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内 容 提 要 


本 书 是 华为 ICT 学 院 数 据 存储 技术 官方 教材 ， 旨 在 帮助 学 生 学 习 数 据 存储 技术 的 基本 概念 和 原理 以 
及 存储 系统 的 搭建 和 使 用 。 

本 书 从 信息 传递 方式 的 变迁 引出 数字 化 信息 管理 与 存储 的 概念 ， 进 而 概述 存储 系统 构成 和 存储 基础 
技术 ， 再 以 磁盘 阵列 技术 作为 案例 来 阐述 在 同一 存储 设备 上 获得 性 能 、 容 量 、 可 用 性 三 方面 提升 的 设计 思 
路 ; 接 下 来 从 存储 接口 、 传 输 协议 、 关 键 技术 和 功能 支持 等 方面 讨论 几 类 存储 系统 ， 包 括 直接 连接 存储 、 
存储 区 域 网 络 、 网 络 附 加 存储 、 海 量 存储 和 灾 备 存储 等 。 

本 书 不 仅 适用 于 华为 ICT 学 院 的 学 生 ， 同 样 适用 于 正在 备考 HCNA-Storage 认证 ， 或 者 正在 参加 
HCNA- Storage 技术 培训 的 学 员 进 行 阅 读 和 参考 。 其 他 有 志 于 从 事 ICT 行业 的 人 员 和 数据 存储 技术 爱好 者 
也 可 以 通过 阅读 本 书 ， 加 深 自 己 对 数据 存储 技术 的 理解 。 
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物 联网 、 云 计算 、 大 数据 、 人 工 智能 等 新 技术 的 兴起 ， 推 动 着 社会 的 数字 化 演进 。 
全 球 正 在 从 “人 人 互联 ”发 展 至 “万 物 互 联 ”%” 未 来 二 三 十 年 ， 人 类 社会 将 演变 成 以 “万 
物 感知 、 万 物 互 联 、 万 物 智能 ”为 特征 的 智能 社会 。 

新 兴 技 术 快 速 渗透 并 推动 企业 加 快 数字 化 转型 ， 企 业 业 务 应 用 系统 趋 于 横向 贯通 ， 
数据 趋 于 融合 互联 ，ICT 正在 成 为 企业 新 一 代 公 共 基 础 设施 和 创新 引擎 ， 成 为 企业 的 核 
心 生 产 系 统 。 据 华为 6IV (全 球 ICT 产业 愿景 ) 预测 ， 到 2025 年 ， 全 球 的 联接 数 将 达到 
1 000 亿 , 85% 的 企业 应 用 上 云 , 100% 的 企业 会 联接 云 服 务 , 工业 智能 的 普及 率 将 超过 20%。 
数字 化 发 展 为 各 行业 带 来 的 纵深 影响 远 超出 想象 。 

作为 企业 数字 化 转型 中 的 关键 使 能 者 ，ICT 人 才 将 站 在 更 新 的 高 度 ， 以 更 为 全 局 的 
视角 审视 整个 行业 ， 并 依靠 新 思想 、 新 技术 驱动 行业 发 展 。 因 此 ， 企 业 对 于 融合 型 ICT 
人 才 需 求 也 更 为 人 迫切。 未 来 5 年 ， 华 为 所 领导 的 全 球 ICT 产业 生态 系统 对 人 才 的 需求 将 
超过 80 万 。 华 为 积累 了 20 余年 的 ICT 人 才 培 养 经 验 ， 对 ICT 行业 发 展现 状 及 趋势 有 着 
深刻 的 理解 。 面 对 数字 化 转型 背景 下 的 企业 ICT 人 才 短 缺 ， 华 为 致力 于 构建 良性 的 ICT 
人 才 生 态 。2013 年 ， 华 为 开始 与 高 校 合 作 ， 共 同 制 定 ICT 人 才 培 养 计 划 ， 设 立 华为 信息 
与 网 络 技术 学 院 〈 简 称 华 为 [CT 学 院 )， 依 据 企业 对 ICT 人 才 的 新 需求 ， 将 物 联 网 、 云 计 
算 、 大 数据 等 新 技术 和 最 佳 实践 经 验 融 入 到 课程 与 教学 中 。 华 为 希望 通过 校 企 合 作 ， 让 
大 学 生 在 校园 内 就 能 掌握 新 技术 ， 并 积累 实践 经 验 ， 促 使 他 们 快速 成 长 为 有 应 用 能 力 、 
会 复合 创新 、 能 动态 成 长 的 融合 型 人 才 。 

教材 是 知识 传递 、 人 才 培 养 的 重要 载体 ,华为 聚合 技术 专家 、 高 校 教师 倾心 打造 ICT 
学 院 系 列 精品 教材 ， 希 望 帮助 大 学 生 快 速 完成 知识 积累 ， 葛 定 坚 实 的 理论 基础 ， 助 力 同 
学 们 更 好 地 开启 ICT 职业 道路 ， 奔 向 更 美好 的 未 来 。 

亲爱 的 同学 们 ， 面 对 新 时 代 对 ICT 人 才 的 呼唤 ， 请 抓 住 历史 机 遇 ， 拥 抱 精彩 的 ICT 
时 代 ， 书 写 未 来 职业 的 光 业 与 梦想 吧 ! 华为 ， 将 始终 与 你 同行 ! 
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人 类 通过 识别 自然 界 和 社会 的 不 同 信息 来 区 分 不 同事 物 ， 进 而 认识 世界 和 改造 世 
界 。 信 息 技 术 推 动 社会 向 前 发 展 ，21 世纪 以 来 ， 信 息 技 术 的 不 断 进 步 加 速 了 全 球 化 进 
程 ， 产 业 格 局 也 随 之 发 生 颠 覆 性 变化 。 随 着 智能 终端 、 互 联网 、 物 联网 、 云 计算 、 社 
交 网 络 的 飞速 发 展 ， 数 据 量 呈 现 日 益 剧 增 趋势 。 图 灵 奖 获得 者 Jim Gray 曾 提出 一 个 经 
验 定律 : “网络 环境 下 每 18 个 月 产生 的 数据 量 等 于 有 史 以 来 数据 量 之 和 ”到 目前 为 止 ， 
数据 量 的 增长 基本 满足 这 个 规律 ， 另外， 数据 已 成 为 一 种 新 的 生产 要 素 ， 与 土地 、 劳 
动力 、 技 术 、 资 本 、 管 理 等 要 素 相 提 并 论 ， 数 据 的 价值 进一步 吓 显 。 如 果 数 据 出 现 丢 
失 或 损坏 ， 不 仅 会 造成 经 济 损失 ， 而 且 会 影响 企业 发 展 。 调 查 显示 ， 全 球 每 年 有 近 百 
万 企业 因数 据 丢 失 而 倒闭 。 因 此 ， 怎 样 安全 可 靠 地 存储 大 规模 数据 成 为 存储 系统 设计 
者 面临 的 一 大 挑战 。 

过 去 儿 十 年 中 ， 存 储 设备 面临 以 下 三 个 挑战 : (1) 性 能 挑战 。 尽 管 单个 存储 设备 的 
性 能 得 到 很 大 发 展 ， 但 其 发 展 速度 仍 赶不上 处 理 器 和 网 络 的 性 能 增长 速度 ，(2) 容量 挑 
战 。 单 个 存储 设备 的 容量 在 快速 增长 ， 却 依然 无 法 满足 新 兴 应 用 的 需求 ;，(3) 可 用 性 挑 
战 。 由 于 存储 介质 单位 容量 密度 提高 ， 存 储 设备 出 现 错误 数 也 增多 ， 而 容量 增长 往往 会 
放大 存储 数据 的 出 错 概率 ， 进 而 影响 到 数据 可 用 性 。 针 对 此 ， 按 照 见 余 放置 、 分 散布 局 
等 方法 来 组 织 和 管理 存储 数据 ， 已 成 为 构建 高 性 能 、 大 容量 、 高 可 用 性 存储 系统 的 一 种 
技术 趋势 。 

因此 , 过 去 十 几 年 , 数据 存储 相关 技术 [如 磁盘 阵列 (RAID)、 存 储 区 域 网 络 (SAN)、 
网 络 附加 存储 NAS) 等] 得 到 越 来 越 广泛 的 关注 ， 并 成 为 科研 界 和 产业 界 的 研究 热点 。 
在 传统 存储 系统 结构 中 , 存储 子 系统 仅仅 被 视 作 主机 /服务 器 的 外 围 1/0 设备 ; 而 现 有 存 
储 系统 则 是 具有 计算 处 理 单元 、 数 据 存储 空间 和 网 络 传输 部 件 的 独立 计算 机 系统 ， 能 够 
提供 独立 的 数据 存储 服务 。 案 例 一 ， 主 机 硬盘 的 容量 扩展 性 和 空间 利用 率 受 到 限制 ， 影 
响 系 统 整体 性 能 的 提升 ， 存 储 阵 列 技术 的 出 现 很 好 地 解决 了 这 一 不 足 ， 其 通过 使 用 多 磁 
盘 并 行 存 取 数 据 来 大 幅 提高 数据 吞吐 率 ; 通过 数据 校 验 来 支持 容错 功能 ， 提 高 存储 数据 
的 可 用 性 。 案 例 二 ， 分 布 式 存储 系统 在 系统 层面 采用 高 速 网 络 技术 连接 多 个 存储 设备 或 
者 存储 服务 器 ， 并 融合 多 种 存储 技术 ， 如 存储 虚拟 化 、 负 载 均 衡 、 副 本 元 余 等 ， 从 而 为 
大 数据 、 云 计算 、 电 子 商务 等 新 兴 应 用 领域 提供 高 可 管理 性 、 高 可 扩展 性 、 高 可 靠 性 的 
存储 解决 方案 。 


数据 存储 技术 


目前 ， 存 储 领 域 的 文献 资料 ， 要 么 为 科研 界 所 关注 的 存储 原理 研究 和 技术 探索 ， 要 
么 为 产品 界 所 侧重 的 技术 开发 文档 和 产品 功能 介绍 。 对 于 大 数据 存储 领域 ， 国 内 外 都 缺 
乏 从 “技术 研究 和 产品 开发 ”两 个 方面 来 介绍 存储 系统 的 教材 ， 而 兼顾 “存储 基础 原理 
及 相关 存储 产品 支撑 技术 ” 正 是 本 书 的 撰写 初衷 。 


本 书 主要 内 容 


本 书 整体 分 为 两 个 部 分 : 第 一 部 分 (包括 第 1~5 章 ) 从 信息 传递 方式 的 变迁 引出 
数字 化 信息 管理 与 存储 的 概念 ， 进 而 概述 存储 系统 构成 和 存储 基础 技术 ， 最 后 以 磁盘 阵 
列 技术 作为 案例 来 阐述 “在 同一 存储 设备 上 获得 性 能 、 容 量 、 可 用 性 三 方面 提升 ”的 设 
计 思 路 ; 第 二 部 分 (从 第 6 一 12 章 ) 从 存储 接口 、 传 输 协 议 、 关 键 技术 和 功能 支持 等 方 
面 来 讨论 几 类 存储 系统 ， 包 括 直 接连 接 存 储 、 存 储 区 域 网 、 网 络 附加 存储 、 海 量 存储 和 
灾 备 存储 等 。 

本 书 各 章 结 合 实际 存储 产品 以 实例 方式 来 细致 描述 存储 系统 的 设计 方案 和 开发 思 
路 ， 有 助 于 读者 加 深 理解 数据 存储 技术 及 其 特点 ， 相 信 本 书 能 为 存储 系统 原理 研究 、 技 
术 开 发 和 产业 发 展 提供 一 定 帮助 。 本 书 主要 面向 信息 存储 领域 的 从 业者 ， 对 专业 研究 者 
和 各 大 院 校 计算 机 系统 结构 专业 师 生 有 一 定 的 参考 作用 。 

第 1 章 信息 数据 管理 

信息 泛 指 人 类 社会 传播 的 一 切 内 容 。 人 类 通过 获取 、 识 别 自然 界 和 社会 的 不 同 信 息 
来 区 别 不 同事 物 ， 在 此 基础 上 认识 世界 和 改造 世界 。 人 类 社会 的 文明 发 展 史 也 是 一 部 信 
息 技术 发 展 史 ， 人 类 经 历 了 五 次 信息 革命 ， 使 得 信息 的 传递 和 存储 超越 了 时 间 和 地 域 的 
限制 ， 而 不 断 积累 的 信息 则 推动 社会 向 前 发 展 。 本 章 主要 介绍 信息 基本 概念 ， 重 点 阐述 
信息 及 信息 存储 的 重要 性 。 

第 2 章 存储 系统 介绍 

在 车 作 《The World Is Flat》 中 ,美国 作家 托马斯 。 弗 里 德 曼 (Thomas L. Friedman) 
阐述 了 一 个 观点 : 21 世纪 以 来 ， 信 息 技 术 的 不 断 进步 加 速 了 全 球 化 进程 。 随 着 信息 化 程 
度 的 不 断 提高 , 人 们 的 生活 已 经 和 信息 技术 密 不 可 分 。 信 息 进行 传输 和 处 理 可 称 为 “ 动 ” 
诚然 ， 有 “ 动 ” 必 有 “ 静 ” 信息 保存 在 存储 介质 可 称 为 “ 静 ”， 本 章 将 对 存储 系统 进行 
详细 的 介绍 。 

第 3 章 存储 技术 和 组 网 

随 着 网 络 信息 化 时 代 的 到 来 ， 知 能 终端 ” 物 联网 、 云 计算 、 社 交 网 络 等 行业 飞速 发 
展 ， 数 据 呈 现 日 益 剧 增 趋势 ， 怎 样 安全 地 、 可 靠 地 存储 大 规模 数据 成 为 存储 系统 设计 的 
一 大 挑战 。 本 章 以 存储 阵列 为 例 ， 围 绕 存 储 容量 扩展 、 数 据 安 全 性 、 数 据 可 靠 性 来 阐述 
存储 阵列 组 网 技术 。 


亚 
中 


第 4 章 传统 磁盘 驱动 器 的 读 写 技术 

20 世纪 80 年 代 以 来 ，CPU 处 理性 能 的 提升 速度 远 高 于 磁盘 驱动 器 的 数据 传输 率 的 
增长 速度 , 两 者 性 能 上 的 不 匹配 严重 制约 了 系统 整体 性 能 的 提升 ,而 RAID 技术 的 出 现 很 
好 地 缓解 了 这 一 矛盾 。RAID 通过 使 用 多 磁盘 并 行 存 取 数 据 来 大 幅 提高 数据 吞吐 率 ; 另外 ， 
通过 数据 校 验 ，RAID 可 以 提供 容错 功能 ， 提 高 存储 数据 的 可 用 性 。 目 前 ，RAID 已 成 为 保 
障 存储 性 能 和 数据 安全 性 的 一 项 基本 技术 。 本 章 主要 讲述 传统 RAID 技术 的 相关 知识 。 

第 5 章 RAID 2.0+ 技 术 

人 硬盘 容量 快速 增长 ， 而 读 写 速 度 却 增长 缓慢 ， 按 照 传 统 RAID 组 重 构 方式 ， 重 构 时 
间 将 大 幅 增加 ， 从 而 导致 “ 重 构 时 间 增 加 ， 重 构 期 间 硬盘 故障 概率 增加 ， 数 据 丢 失 风 险 
随 之 增 大 ”这 一 问题 。 针对 此 , 一 些 存 储 公 司 将 磁盘 阵列 从 基于 磁盘 的 RAID 发 展 成 基于 
块 虚拟 化 的 RAID 2. 0/RAID 2. 0+ 技 术 ， 不 仅 大 大 降低 重 构 时 间 ， 提 高 系统 可 靠 性 ， 而 且 
充分 满足 虚拟 机 环境 对 存储 的 应 用 需求 。 本 章 重 点 介绍 RAID 2. 0/RAID 2. 0+ 技 术 ， 特 别 
是 RAID 2. 0+ 技 术 的 工作 原理 。 

第 6 章 DAS 技术 介绍 

直接 连接 存储 (Direct Attached Storage，DAS) 是 一 种 将 存储 设备 通过 电缆 直接 
连接 到 主机 服务 器 上 的 一 种 存储 方式 。 数 据 存储 设备 采用 SCSI 或 FC 协议 直接 连接 在 内 
部 总 线 上 ， 构 成 整个 服务 器 结构 的 一 部 分 。 本 章 介绍 直接 连接 存储 的 相关 内 容 ， 以 及 存 
储 系统 中 基本 而 常用 的 SCSI 协议 。 

第 7 章 SAN 技术 介绍 

存储 区 域 网 络 (Storage Area Network，SAN) 是 一 种 面向 网 络 的 、 以 数据 存储 为 
中 心 的 存储 架构 。SAN 采用 可 扩展 的 网 络 拓扑 结构 连接 服务 器 和 存储 设备 ， 并 将 数据 的 
存储 和 管理 集中 在 相对 独立 的 专用 网 络 中 ， 向 服务 器 提供 数据 存储 服务 。 以 SAN 为 核心 
的 网 络 存储 系统 具有 和 良好 的 可 用 性 、 可 扩展 性 、 可 维护 性 ， 能 保障 存储 网 络 业 务 的 高 效 

第 8 章 常用 存储 高 级 技术 

随 着 信息 技术 的 发 展 ， 企 业 数 据 量 增多 ， 很 多 企业 考虑 购置 或 已 经 购置 满足 需求 的 
存储 产品 ， 然 而 ， 在 存储 产品 使 用 过 程 中 常常 会 面临 存储 空间 浪费 、 存 储 性 能 低下 、 数 
据 丢失 等 问题 。 本 节 的 存储 高 级 技术 涉及 提高 空间 利用 率 、 提 升 存 储 性 能 、 增 强 数据 可 
用 性 等 方面 ， 掌 握 本 章 知识 有 助 于 系统 架构 师 在 前 期 规划 、 中 期 实施 、 后 期 优化 中 最 大 
化 利用 存储 资源 以 满足 用 户 需 求 。 

第 9 章 NAS 技术 介绍 

网 络 附加 存储 (Network Attached Storage，NAS) 是 基于 IP 网络、 通过 文件 级 的 
数据 访问 和 共享 提供 存储 资源 的 网 络 存储 架构 。 本 章 主要 介绍 NAS 产生 与 发 展 的 背景 以 
及 NAS 的 组 成 与 部 件 ， 重 点 介绍 NAS 文件 共享 协议 CIFS 和 NEFS， 并 概括 NAS 与 SAN 两 者 
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的 区 别 。 

第 10 章 大 数据 存储 基础 

博客 、 社 交 网络 、 云 计算 、 物 联网 等 新 兴 服 务 促使 人 类 社会 的 数据 种 类 和 规模 以 前 
所 未 有 的 速度 发 展 ， 大 数据 时 代 正 式 到 来 ， 而 数据 也 从 一 种 简单 处 理 对 象 转变 为 基础 性 
资源 。 一 方面 ， 如 何 更 好 地 存储 、 管 理 、 分 析 和 利用 大 数据 已 成 为 科研 界 和 产业 界 共同 
关注 的 话题 另 一 方面 ， 大 数据 的 规模 效应 给 数据 存储 、 管 理 及 分 析 利 用 带 来 了 极 大 的 
技术 挑战 。 本 章 主要 介绍 大 数据 的 由 来 、 定 义 、 组 成 、 特 征 以 及 处 理 方式 等 ， 并 概述 大 
数据 的 相关 知识 和 大 数据 管理 系统 的 设计 需求 。 

第 11 章 容 灾 备份 技术 基础 

随 着 IT 技术 的 广泛 应 用 ， 各 类 应 用 系统 均 对 存储 提出 了 安全 性 需求 和 业务 连续 性 
需求 。 为 了 增强 数据 安全 性 ， 企 业 需 要 使 用 数据 备份 技术 。 为 了 保障 业务 连续 性 和 系统 
可 用 性 ， 企 业 需 要 使 用 容 灾 技 术 。 本 章 主要 介绍 容 灾 和 备份 的 技术 基础 。 

第 12 章 ”存储 系统 配置 、 运 维和 管理 

当 企 业 、 政 府 、 研 究 所 等 机 构 购 买 存储 设备 或 存储 系统 后 ， 往 往 需 要 进行 配置 与 部 
署 。 具 体 地 ， 在 使 用 存储 系统 时 ， 为 了 保证 业务 能 正常 、 顺 利 地 运行 ， 往 往 需要 人 为 参 
与 管理 ， 而 存储 系统 在 运行 过 程 中 ， 可 能 会 遇 到 因 操作 不 当 等 因素 而 引起 的 人 为 故障 ， 
导致 业务 中 断 ， 甚 至 数据 丢失 ， 造 成 巨大 的 损失 。 因 此 ， 掌 握 存储 系统 的 配置 、 运 维和 
管理 方法 是 至 关 重 要 的 ， 本 章 详 细 介 绍 这 些 方 法 。 
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信息 泛 指 人 类 社会 传播 的 一 切 内 容 。 人 类 通过 获取 、 识 别 自然 界 和 社会 的 不 同 信息 
来 区 别 不 同事 物 ， 在 此 基础 上 认识 世界 和 改造 世界 。 人 类 社会 的 文明 发 展 史 也 是 一 部 信 
息 技术 发 展 史 ， 人 类 经 历 了 5 次 信息 革命 ， 使 信息 的 传递 和 存储 超越 了 时 间 和 地 域 的 限 
制 ， 而 不 断 积累 的 信息 则 推动 社会 向 前 发 展 。 本 章 主要 介绍 信息 的 基本 概念 ， 重 点 阐述 
信息 及 信息 存储 的 重要 性 。 


apaspppsNs mmissiondeanstnntistssras its ets... 


三 所 3 。 了 解 信息 技术 发 展 史 ; 
| 习气 :99。 掌 握 数据 和 信息 的 基本 概念 ， 理 解数 据 和 信息 的 关系 ; 


| 目 志 -2 。 了 解 信息 的 重要 性 ; 
你 。。。 了 解 信息 存储 的 重要 性 . 


TT TT 





i 1.1 信息 技术 发 展 史 人 


在 人 类 发 展 历程 中 ， 物 质 、 能 量 和 信息 是 支配 人 类 活动 的 三 种 不 可 或 缺 的 要 素 。 当 
今 社会 ， 信 息 无 处 不 在 ， 它 在 人 类 社会 生活 的 各 个 方面 和 各 个 领域 被 广泛 使 用 。 然 而 对 
于 信息 却 没有 公认 的 定义 。 下 面 列举 了 一 些 比较 典型 和 具有 代表 性 的 定义 ， 使 读者 对 信 
息 的 概念 有 一 个 比较 全 面 的 认识 。 

信息 就 是 信息 ， 既 不 是 物质 也 不 是 能 量 。 

信息 是 事物 之 间 的 差异 。 
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信息 是 系统 的 复杂 性 。 

信息 是 事物 相互 作用 的 表现 形式 。 

信息 是 物质 的 普遍 属性 。 

信息 是 消除 不 确定 性 的 东西 。 

信息 是 反映 的 差异 。 

信息 就 是 消息 。 

信息 就 是 信号 。 

信息 就 是 经 验 。 

信息 是 资料 。 

信息 就 是 知识 。 

这 些 对 信息 的 理解 ， 有 从 哲学 角度 出 发 的 ， 有 从 经 济 和 角度 出 发 的 ， 有 从 文化 角度 出 
发 的 。 广 义 上 的 信息 包含 了 自然 界 和 人 类 社会 中 的 各 种 信息 ， 而 本 文 的 研究 对 象 是 计算 
机 科学 领域 的 存储 信息 。 

人 类 社会 的 文明 发 展 史 也 是 一 部 信息 技术 发 展 史 ， 下 面 介 绍 一 下 信息 的 发 展 历程 。 
- 般 来 说 ， 从 古 至 今 ， 人 类 经 历 了 5 次 信息 革命 ， 有 具体 如 下 。 

1. 第 一 次 信息 革命 

第 一 次 信息 技术 革命 的 标志 是 语言 的 使 用 ， 发 生 在 距 今 约 50000 年 前 。 

语言 的 使 用 是 从 猜 进 化 到 人 的 一 个 重要 标志 。 

类 人 狼 是 一 种 类 似 于 人 类 的 猿 类 ， 经 过 千 百 万 年 的 劳动 过 程 ， 演 变 、 进 化 、 发 展 成 
为 现代 人 ， 与 此 同时 ， 语 言 也 随 着 劳动 而 产生 。 

2， 第 二 次 信息 革命 

第 二 次 信息 技术 革命 的 标志 是 文字 的 创造 。 大 约 在 公元 前 3500 年 出 现 了 文字 。 文 
字 的 创造 使 得 信息 的 存储 和 传递 打破 了 时 间 和 地 域 的 限制 。 

如 在 原始 社会 母系 氏族 繁荣 时 期 的 居民 使 用 的 陶器 上 发 现 了 符号 。 河 姆 渡 和 半 坡 原 
始 居 民 是 母系 氏族 公社 繁荣 时 期 的 代表 。 大 约 在 公元 前 5000 年 至 公元 前 3000 年 ， 河 姆 
渡 和 半 坡 原始 居民 已 经 普遍 使 用 磨 制 石器 ， 并 且 会 烧 制 陶器 。 河 姆 渡 的 黑 陶 是 用 谷 党 与 
泥土 混合 烧 制 而 成 ， 而 半 坡 彩陶 品种 样式 多 ， 上 面 绘 有 构思 巧妙 的 花纹 ， 是 原始 艺术 的 
精品 。 

甲骨 文字 可 考 的 历史 从 商 朝 开始 ， 甲 骨 文 是 一 种 比较 成 熟 的 文字 ， 反 映 了 商 王 的 活 
动 和 商 朝 的 社会 生产 状况 、 阶 级 关系 ， 记 录 了 商 朝 后 期 大 量 的 史实 。 

金 文 〈 也 叫 铜 器 铭文 )， 它 是 一 种 铸 刻 在 青铜 器 的 钟 或 易 上 的 文字 。 金 文 起 于 商 
代 ， 盛 行 于 周 代 ， 是 在 甲骨 文 的 基础 上 发 展 起 来 的 文字 。 因 和 铸 刻 于 钟 易 之 上 ， 有 时 也 
称 为 “ 钟 易 文 ”% 据 统计 ， 可 知 的 金 文 有 一 千 多 字 ， 较 甲骨 文 略 多 。 金 文 上 承 甲 骨 文 ， 
下 启 秦 代 小 每 ,流传 书 迹 多 刻 于 钟 鼎 之 上 ， 所 以 较 甲 骨 文 更 能 保存 书写 原 迹 ， 具有 古 
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朴 的 风格 。 

3. 第 三 次 信息 技术 革命 

第 三 次 信息 技术 革命 的 标志 是 印刷 术 的 发 明 。 北宋 庆 历年 间 (1041 年 一 1048 年 ) 
中 国 的 毕 异 〈970 年 一 1051 年 ) 发 明了 泥 活 字 ， 标 志 活 字 印 刷 术 的 诞生 。 他 是 世界 
上 第 一 个 发 明 活 字 印 刷 术 的 人 ， 比 德国 人 约翰 内 斯 。 古 腾 堡 发 明 活 字 印 刷 术 早 约 
400 年 。 

纸张 是 重要 的 信息 存储 介质 。 汉 朝 以 前 使 用 竹 木 简 或 帅 作 书写 材料 。 公 元 105 年 ， 东 汉 
的 蔡伦 改进 了 造纸 术 ， 被 封 为 “ 龙 亭 侯 ”。 由 于 新 造纸 方法 是 蔡伦 发 明 的 ， 人 们 把 这 种 采用 新 
造纸 方法 生产 出 来 的 纸 叫 “ 获 侯 纸 ” 从 后 唐 到 后 周 ， 封 建 政府 驹 版 刊印 了 癸 家 经 书 ， 这 是 我 
国 官府 大 规模 印 书 的 开始 ， 成 都 、 开 封 、 临 安 和 建 阳 是 当时 导 版 印刷 中 心 。 

4. 第 四 次 信息 革命 

第 四 次 信息 革命 的 标志 是 电报 、 电 话 、 广 播 和 电视 的 发 明和 普及 应 用 。19 世纪 
中 期 以 后 ， 随 着 电报 、 电 话 的 发 明 ， 以 及 电磁 波 的 发 现 ， 人 类 通信 和 领域 产生 了 根本 
性 的 变革 ， 实 现 了 通过 金属 导线 上 的 电 脉冲 来 传递 信息 以 及 通过 电磁 波 来 进行 无 线 
通信 。 

图 1-1 为 1837 年 美国 人 莫 尔 斯 研制 的 世界 上 第 一 台 有 线 电报 机 。 





图 1-1 电报 机 


1864 年 英国 著名 物理 学 家 麦克 斯 书 发 表 了 一 篇 论文 《 电 与 磁 》。 在 这 篇 论文 中 麦克 
斯 韦 预 言 了 电磁 波 的 存在 ， 说 明了 电磁 波 与 光 具 有 相同 的 性 质 ， 都 是 以 光速 传播 的 。 

1875 年 ， 亚 历 山 大 。 贝尔 发 明了 世界 上 第 一 台电 话机 ， 并 于 1878 年 在 相距 300 千 
米 的 波 世 顿 和 纽约 之 间 进 行 了 首次 长 途 电话 实验 ， 并 获得 成 功 。 

1876 年 3 月 10 日， 贝尔 用 自制 的 电话 同 他 的 助手 通 了 话 。 

1895 年 俄国 人 波 波 夫 和 意大利 人 马 可 尼 分 别 成 功 地 进行 了 无 线 电 通信 实验 。 
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1894 年 电影 问世， 爱迪生 实验 室 发 明了 “电影 视 镜 ” 仅 供 一 人 观赏 。 
1925 年 ， 英 国 的 电子 工程 师 约翰 。 贝 尔 德 首次 成 功 装配 世界 第 一 台电 视 机 ， 并 进行 
首次 播映 。 


5. 第 五 次 信息 技术 革命 
第 五 次 信息 技术 革命 的 标志 是 电子 计算 机 的 普及 应 用 ， 以 及 计算 机 与 现代 通信 技术 
的 结合 。 计 算 机 技术 与 现代 通信 技术 的 普及 应 用 始 于 20 世纪 60 年 代 ， 这 是 一 次 信息 传 

播 和 信息 处 理 的 革命 ， 对 人 类 社会 产生 了 空前 的 影响 ， 使 信息 数字 化 成 为 了 可 能 ， 从 而 
使 信息 产业 得 以 发 展 。 

1946 年 ， 世 界 上 第 一 台 通 用 计算 机 “ENIAC” 在 美国 宾 锈 法 尼 亚 大 学 诞生 ， 发 明 人 
是 美国 人 英 克 利和 艾 克 特 。 美 国 国防 部 用 它 来 进行 弹道 计算 。 如 图 1-2 所 示 ， 它 是 一 个 
庞然大物 ， 用 了 18000 个 电子 管 ， 占 地 170 平方 米 ， 重 达 30 吨 ， 耗 电功率 约 150 千瓦 ， 
每 秒 可 进行 5000 次 运算 。 





图 1-2 第 一 代 电 子 计 算 机 


计算 机 的 发 展 经 历 了 以 下 几 个 阶段 。 

1946 一 1958 年 第 一 代 电 子 计算 机 。 

1958 一 1964 年 第 二 代 晶 体 管 电子 计算 机 。 

1964 一 1970 年 第 三 代 集 成 电路 计算 机 。 

1971 一 20 世纪 80 年 代 第 四 代 大 规模 集成 电路 计算 机 。 
至 今 正在 研究 第 五 代 智 能 化 计算 机 。 


1.2 数据 与 信息 概述 


经 稍 能 听 到 “互联 网 引发 数据 大 爆炸 ”“ 现 在 是 一 个 信息 大 爆炸 的 时 代 ”“ 数 据 是 爆 
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炸 了 ， 信 息 却 很 贫乏 ”等 用 语 ， 那 么 数据 与 信息 之 间 到 底 是 什么 关系 ? 
1.2.1 数据 的 概念 


数据 是 指 对 客观 事件 进行 记录 并 可 以 鉴别 的 符号 ， 是 针对 客观 事物 的 相互 关系 、 
状态 和 性 质 等 进行 记录 的 物理 符号 或 多 种 物理 符号 的 组 合 。 它 是 可 以 鉴别 的 、 抽 象 的 
符号 。 

数据 可 以 指 狭义 上 的 数字 ， 如 银行 账户 上 的 存款 余额 、 道 路 宽度 、 城 市 面积 等 ， 也 
可 以 是 具有 一 定 意义 的 文字 、 字 母 、 数 字符 号 的 组 合 、 图 形 、 图 像 、 视 频 、 音 频 等 ， 还 
可 以 是 客观 事物 的 属性 、 数 量 、 位 置 及 其 相互 关系 的 抽象 表示 ， 例 如 ,，“0、1、2…… . 
“ 阴 、 雨 、 湿 度 、 气 温 ”、 学 生 的 档案 记录 、 货 物 的 运输 情况 等 。 

在 计算 机 科学 中 ， 数 据 指 的 是 输入 到 计算 机 内 的 所 有 可 以 被 计算 机 处 理 的 符号 或 符 
号 组 合 的 总 称 ， 同 时 也 是 用 于 输入 计算 机 中 进行 处 理 的 具有 一 定 含义 的 数字 、 字 母 和 字 
符 串 等 的 通称 。 现 在 计算 机 处 理 的 对 象 十 分 广泛 ， 存 储 的 内 容 多 样 ， 即 表示 这 些 对 象 的 
数据 也 随 之 变 得 越 来 越 复杂 。 

存储 网 络 工业 协 会 (Storage Networking Industrial Association，SNIA) 关于 
数据 的 定义 是 “The digital representation of anything in any form”， 含 义 是 “ 数 
据 是 对 任意 形式 的 任何 事物 的 数字 表示 ”。 

根据 数据 结构 特征 ， 数 据 主 要 可 以 分 为 : 结构 化 数据 、 半 结构 化 数据 和 非 结构 化 
数据 。 能 够 用 数据 或 统一 的 结构 加 以 表示 的 数据 ， 如 数字 、 符 号 。 结 构 化 数据 可 以 用 
二 维 表 结构 来 多 辑 表达 ， 是 传统 的 关系 数据 模型 中 的 行 数据 包括 财务 系统 、 企 业 资 源 
计划 系统 (Enterprise Resource Planning，ERP)、 客 户 关 系 管 理 系统 (Customer 
Relationship Management, CRM) 等 ， 在 其 数据 库 中 存储 的 都 是 结构 化 数据 。 半 结构 化 
数据 是 结构 化 数据 的 一 种 表达 形式 ， 它 是 位 于 结构 化 和 完全 无 结构 (如 声音 、 图 像 文 
件 等 ) 之 间 的 数据 。 半 结构 化 数据 中 同一 类 集合 可 以 有 不 同 的 属性 ， 即 使 他 们 被 组 合 
在 一 起 ， 这 些 属性 的 顺序 并 不 重要 ; 它 还 可 以 自由 地 传达 出 很 多 需要 的 信息 ， 所 以 半 
结构 化 数据 具有 很 好 的 扩展 性 ， 如 XML 和 JSON。 非 结构 化 数据 是 指 其 字段 长 度 可 变 ， 
不 方便 采用 结构 化 数据 来 于 和 辑 表达 的 数据 ， 非 结构 化 数据 包括 全 文 文本 、 办 公文 档 、 
图 像 、 图 片 、 声 音 、 音 频 、 影 视 、 视 频 和 各 类 报表 等 数据 。 

统计 表明 ， 在 上 文 的 各 种 结构 数据 中 ， 大 多 数 商 业 企 业 产生 和 存放 的 数据 中 70% 都 
是 静态 数据 。 所 谓 静 态 数据 就 是 那些 被 保存 之 后 在 较 长 的 时 间 内 不 会 被 访问 的 数据 ， 在 
较 长 的 时 间 内 不 会 被 访问 。 这 就 带 来 一 个 问题 “是 否 有 必要 保存 这 些 长 时 间 不 被 访问 的 
数据 ”。 按 照 信息 生命 周期 管理 的 理念 ， 信 息 需要 经 历 “消亡 ”过 程 ; 然而 ， 很 多 企业 无 
法 判断 这 些 数据 的 价值 ， 这 些 数据 是 否 是 有 用 的 信息 ， 将 来 有 没有 可 能 会 用 到 这 些 数 据 
或 信息 ， 因 此 只 好 先 保存 这 些 数据 和 信息 。 
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1.2.2 ”信息 的 概念 


信息 是 一 种 经 过 挑选 、 分 析 和 综合 的 数据 ， 用 户 可 以 在 使 用 过 程 中 对 正在 发 生 的 事 
有 更 清晰 的 认 知 。 换 言 之 ， 信 息 是 加 工 后 的 数据 。 所 以 ， 数 据 是 原材料 ， 信 息 是 产品 ， 
信息 是 数据 的 表现 形式 。 

数据 和 信息 是 相对 的 ， 如 某 些 数据 对 某 些 人 而 言 是 数据 不 是 信息 ， 而 对 另外 某 些 人 
而 言 则 是 信息 而 不 是 数据 。 例如， 在 物流 运输 中 ， 物 流 运 输 单 对 司机 或 快递 员 而 言 是 信 
息 ， 因 为 司机 或 快递 员 可 以 从 该 快递 单 上 知道 运输 时 间 、 运 输 物 品 、 客 户 地 址 等 信息 ; 
而 对 负责 经 营 的 管理 者 来 说 ， 运 输 单 只 是 经 营 数据 ， 因 为 具有 运输 单 无 法 提供 本 月 运输 
物品 数量 、 现 有 空闲 司机 或 快递 员 、 现 有 空闲 运输 工具 等 信息 。 

信息 的 获取 受到 人 的 主观 因素 影响 ， 因 为 信息 是 加 工 了 的 数据 ， 所 以 采用 什么 模型 
(或 公式 )、 多 长 的 时 间 间 隔 来 加 工 数据 以 获得 信息 ， 受 到 人 对 客观 事物 变化 规律 的 认识 
的 制约 ， 并 由 人 的 知识 水 平 决定 。 因 此 ， 揭 示 数 据 内 在 含义 的 信息 是 主观 的 。 

信息 的 功能 同 信息 的 形态 密 不 可 分 ， 并 往往 融合 在 一 起 。 例 如 ， 信 息 的 形态 是 指 信 
息 的 “模样 >， 而 信息 的 功能 是 指 信息 “能 干什么 ” 信息 有 4 种 形态 ， 分 别 是 : 数据 、 
文本 、 声 音 、 图 像 。 这 4 种 形态 可 以 相互 转换 。 信 息 能 通过 4 种 形态 中 的 任意 一 种 形态 
“ 捕 提 ”到 环境 中 存在 的 数据 ， 并 把 它 表 示 出 来 。 例 如 ， 打 字 机 捕获 作者 写 出 的 文字 ， 并 
把 它 生 成 书籍 ， 录音 机 捕获 歌唱 家 发 出 的 声音 ， 并 把 它 生 成 录音 带 ; 照相 机 捕获 了 风景 
的 图 像 ， 并 把 它 生 成 图 画 等 。 实 际 上 ， 信 息 的 生成 就 是 把 已 知 的 数据 用 一 种 容易 理解 的 
形式 表现 出 来 。 因 为 计算 机 和 网 络 的 发 展 ， 数 字 信 息 也 成 为 主流 。 数 字 信 息 就 是 把 信息 
数字 化 ， 将 其 整理 成 “二 进位 制 ” 数 。 一 旦 信息 被 数字 化 一 一 变 成 “0” 和 “1”， 所 有 形 
态 的 信息 都 能 被 处 理 。 当 照片 被 分 解 〈 即 ,“ 读 ” 成 数字 《〈 即 ， 图 ) 时 ， 图 中 的 每 一 个 
点 都 被 赋予 一 定 的 值 ， 然 后 ， 照 片 便 能 通过 网 络 发 送出 去 。 


1.2.3 ”数据 与 信息 的 关系 


数据 和 信息 之 间 是 相互 联系 的 。 数 据 是 反映 客观 事物 属性 的 记录 ， 是 信息 的 具体 表 
现形 式 。 数 据 经 过 加 工 处 理 之 后 ， 就 成 为 信息 ; 而 信息 需要 经 过 数字 化 转变 成 数据 才能 
存储 和 传输 。 

从 信息 论 的 观点 来 看 ， 描 述 信 源 的 数据 是 信息 和 数据 元 余 ， 即 : 数据 = 信息 + 数 
据 见 余 ， 如 图 1-3 所 示 ， 数 据 元 余 指 在 一 个 数据 集合 中 重复 的 数据 。 数 据 是 数据 采集 时 
提供 的 ， 信 息 是 从 采集 的 数据 中 获取 的 有 用 数据 ， 简 言 之 ， 数 据 经 过 加 工 处 理 才 能 得 到 
有 用 数据 ， 即 信息 。 由 此 可 见 ， 可 以 简单 地 将 信息 理解 为 数据 中 包含 的 有 用 内 容 。 

上 面 定 性 分 析 了 数据 和 信息 之 间 的 区 别 和 联系 ， 下 面 对 数 据 和 信息 进行 定量 分 析 。 
数据 量 大 并 不 意味 着 信息 量 大 。 同 时 ， 一 个 消息 越 不 可 预测 ， 它 所 含 的 信息 量 就 越 大 。 
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图 1-3 数据 与 信息 


事实 上 ， 信 息 的 基本 作用 就 是 消除 人 们 对 事物 了 解 的 不 确定 性 。 信 息 量 是 指 从 六 个 
相等 的 可 能 事件 中 选 出 一 个 事件 所 需要 的 信息 度量 和 含量 。 在 概率 论 中 , 用 P(x) 表示 
在 VW 个 相等 的 可 能 事件 出 现 某 一 个 事件 的 概率 ， 即 PLo =1/N 信息 量 7 (x) 定义 为 : 

IT(D=logs(N)=-log:(1/N)=-logz(P(D) 

从 这 个 定义 看 ， 信 息 量 跟 概 率 是 密切 相关 的 ， 具 体 地 ， 事 件 4 的 概率 P(x) 越 低 ， 

即 x 越 是 小 概率 事件 ，x 所 包含 的 信息 量 (x) 就 越 大 。 


ron pi 信息 的 重要 性 


信息 的 重要 性 是 不 言 而 喻 的 ， 它 已 经 影响 到 了 当今 社会 的 方方面面 ， 在 生活 中 去 医 
院 看 病 ， 医 生 需要 知道 您 身体 的 信息 ; 在 商业 活动 中 如 果 没 有 信息 即使 企业 资金 等 充足 
也 会 使 企业 缺乏 活力 ; 在 工业 活动 中 信息 可 以 提高 生产 力 ; 在 社会 活动 中 信息 可 以 促进 
社会 体系 产生 变革 等 。 

学 者 詹姆斯 。 马丁 认为 科学 技术 的 “和 裂变 效应 ”将 导致 知识 更 新 速度 不 断 加 快 ， 现 
代 科学 技术 的 发 展 极其 迅速 并 越 来 越 快 ， 新 的 科技 知识 和 信息 量 增 速 极 大 且 体 量 惊人 。 
人 类 知识 信息 的 倍增 周期 在 缩短 ， 如 在 19 世纪 ， 人 类 知识 倍增 周期 为 50 年 ，20 世纪 中 
期 为 10 年 左右 ， 到 了 20 世纪 70 年 代 缩短 为 5 年 ，20 世纪 80 年 代 末 90 年 代 初 知识 已 
倍增 到 了 每 3 年 翻 一 番 的 程度 。 近 年 来 ,每 年 出 版 的 图 书 达 50 多 万 种 ,每 年 出 版 的 音像 
制品 5 万 多 种 ， 每 年 登记 的 新 专利 达 70 万 项 ， 全 世界 每 天 发 表 的 论文 达 13000 一 14000 
篇 。 新 理论 、 新 材料 、 新 工艺 、 新 方法 的 不 断 涌现 ， 使 知识 更 新 的 速度 加 快 。 数 据 表 明 
“ 据 统 计 ， 一 个 人 所 掌握 的 知识 半衰期 在 18 世纪 为 80 一 90 年 ，19 一 20 世纪 为 30 年 ，21 
世纪 60 年 代为 15 年 ， 进 入 21 世纪 80 年 代 ， 缩 短 为 5 年 左右 ， 近 十 年 更 是 缩短 为 3 年 
左右 。 还 有 报告 称 ， 全 球 印刷 信息 的 生产 量 每 5 年 翻 一 番 , 《纽约 时 报 》 一 周 的 信息 量 即 
相当 于 17 世纪 学 者 毕生 所 能 接触 到 的 信息 量 的 总 和 。 近 30 年 来 ， 人 类 生产 的 信息 已 超 
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过 过 去 5000 年 信息 生产 的 总 和 。"” 
信息 量 增长 的 速度 远 比 人 类 理解 的 速度 要 快 ， 并 渗透 到 人 类 的 各 个 方面 。 


1.3.1 信息 与 生活 


当代 ， 信 息 已 经 切切 实 实 影响 到 人 们 的 目 常 生活 ， 信 息 技术 也 已 经 发 展 到 了 可 以 超 
越 时 空 距离 的 和 程度， 数字化、 网 络 化 、 智 能 化 已 成 为 人 们 不 可 或 缺 的 生活 模式 和 生存 
方式 。 公 交 地 铁 、 手 机 通信 、 水 电 缴费 、 图 书 借阅 、 酒 店 就 餐 、 超 市 购物 、 银 行 支付 等 
部 需要 用 到 信息 。 

通信 工具 使 信息 的 流通 更 加 通畅 ， 信 息 正 日 益 成 为 百姓 日 常生 活 不 可 或 缺 的 主体 。 
现在 人 们 利用 手机 可 以 上 网 冲浪 、 下 载 音乐 、 搜 索 视频 ， 感 受 网 络 世界 的 精彩 ， 还 可 以 
享受 手机 银行 、 手 机 炒股 、 手 机 购物 等 多 种 “以 手 代 步 ”的 便捷 服务 。 手 机 为 移动 办 公 
和 休闲 娱乐 提供 了 诸多 便利 。 信 息 技术 的 发 展 颠覆 了 许多 传统 的 生活 模式 ， 例 如 手机 作 
为 信息 化 终端 设备 的 出 现 ， 功 能 手机 以 语音 通信 功能 为 主 ， 而 智能 手机 可 支持 发 烧 级 别 
的 音响 效果 以 及 媲美 专业 相机 的 拍照 功能 。 蔷 果 手 机 于 2014 年 10 月 上 线 的 Apple Pay 
功能 支持 手机 支付 ， 使 手机 有 了 银行 卡 功能 。 

除了 个 人 ,企业 和 机 构 也 离 不 开 信息 通信 。 在 政府 机 构 、 企 事业 单位 云集 的 城市 中 ， 
信息 沟通 方式 的 变迁 也 让 人 惊叹 。 网 上 办 公 、 网 上 交易 、 网 上 查询 等 一 系列 互联 网 应 用 ， 
使 得 宽带 通信 成 为 不 可 缺少 的 电子 商务 渠道 。 利 用 视频 会 议 系统 ， 政 府 机 关 和 大 型 企业 
不 仅 节 约 了 成 本 ， 而 且 提升 了 工作 效率 。 特 别 是 在 重大 事件 发 生 时 ， 各 级 政府 能 通过 这 
一 系统 迅速 做 出 反应 和 部 署 。 


1.3.2 ”信息 与 商业 


从 广义 的 角度 上 讲 ， 商 业 信 息 是 指 能 够 反映 商业 经 济 活动 情况 、 与 商品 交换 和 管理 
有 关 的 各 种 消息 、 数 据 、 情 报 和 资料 的 统称 。 商 业 信 息 的 范畴 不 但 包括 直接 反映 商业 购 
销 和 市 场 供求 变化 的 信息 ， 而 且 包 括 各 种 影响 市 场 供求 关系 的 信息 ， 如 自然 灾害 或 政治 
事件 会 影响 当年 或 来 年 市 场 商 品 的 购买 力 , 有 关 这 方面 的 信息 也 可 纳入 商业 信息 的 范围 。 
从 狭义 的 角度 看 ， 商 业 信 息 是 指 直接 反映 商品 买卖 活动 的 特征 、 变 化 等 情况 的 各 种 消息 、 
情报 、 资 料 的 统称 。 

随 痢 世界 经 济 和 科技 的 迅猛 发 展 ， 生 产 社 会 化 的 程度 越 来 越 高 ， 而 随 着 信息 时 代 的 
到 来 ， 商 业 企业 管理 的 本 质 和 核心 就 是 对 企业 信息 流 进 行 有 效 控制 。 业 界 流 行 这 样 一 种 
观点 ， 即 “控制 信息 就 是 控制 企业 的 命运 ， 失 去 信息 就 失去 一 切 ” 这 充分 说 明了 信息 对 
企业 的 重要 性 。 从 商业 企业 管理 的 角度 看 ， 现 代 商 业 信息 主要 有 以 下 几 个 特点 。 

(1) 信息 量 急 剧 增加 。“ 信 息 爆 炸 ”“ 知 识 爆炸 ”是 这 个 时 代 的 特征 之 一 ,“ 信 息 爆 
炸 ” 主 要 体现 为 信息 量 呈 爆炸 式 增长 。19 世纪 ， 人 类 的 知识 每 50 年 增长 1 倍 ; 20 世纪 ， 
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每 10 年 增长 1 倍 ; 目前 信息 的 增长 量 每 2 年 增长 1 倍 。 

(2) 信息 处 理 与 传递 的 高 度 现代 化 。20 世纪 50 年 代 中 期 计算 机 进入 流通 领域 以 后 ， 
商业 营销 活动 发 生 了 重大 变革 。 从 购销 货物 统计 、 费 用 核算 、 市 场 预测 与 分 析 ， 到 库存 
控制 、 资 金管 理 、 工 资 结算 ， 都 可 以 利用 计算 机 完成 ， 企 业 的 信息 处 理 技术 及 设备 日 益 
向 着 高 度 现代 化 发 展 。 

(3) 处 理 方法 的 复杂 化 。 随 着 市 场 竞争 的 日 益 激 烈 ， 为 了 挖 据 潜力 ， 获 得 最 大 的 经 
济 效益 ， 企 业 会 不 断 提 高 其 管理 水 平 ， 企 业 的 决策 过 程 也 将 越 来 越 复杂 。 另 外 ， 企 业 对 
信息 的 及 时 性 、 可 靠 性 、 准 确 性 、 时 效 性 要 求 越 来 越 高 ， 这 也 导致 了 信息 处 理 的 复杂 度 
大 大 增加 。 

商业 信息 是 人 们 对 与 商业 活动 相关 的 事物 及 其 变化 规律 的 认识 。 这 些 认识 被 某 种 载 
体 记录 ， 进 而 加 工 、 处 理 和 传播 ， 使 其 具有 更 高 的 利用 价值 。 

在 商业 信息 系统 中 ， 商 业 信息 以 某 种 方式 被 记录 下 来 ， 由 此 产生 商业 数据 ， 由 此 可 
见 ， 商 业 数 据 是 记录 商业 信息 的 载体 ， 而 商业 信息 是 对 商业 数据 的 解释 ， 是 具有 价值 的 
数据 。 对 商业 数据 进行 计算 加 工 ， 得 到 新 的 商业 数据 ， 这 些 新 的 商业 数据 可 以 为 进一步 
的 管理 、 决 策 提供 依据 ， 是 具有 更 高 价值 的 商业 信息 ， 经 过 这 样 螺旋 式 的 上 升 ， 商 业 信 
息 管 理 将 成 为 商品 流通 和 企业 不 断 发 展 的 推动 力 ， 这 也 正 是 管理 商业 信息 的 最 终 目 的 。 

信息 在 现代 经 济 生活 中 的 作用 越 来 越 大 ， 已 经 成 为 市 场 竞争 的 重要 和 手段。 对 于 企业 
来 说 ， 信 息 的 重要 性 更 是 不 言 而 喻 。 缺 乏 信 息 ， 即 使 有 了 资金 、 厂 房 、 物 资 和 能 源 ， 维 
持 企业 也 十 分 困难 ， 因 为 企业 没有 生命 力 。 因 而 ， 对 企业 来 说 ， 商 业 信 息 是 最 重要 的 资 
源 ， 谁 占有 的 信息 多 、 掌 握 的 信息 准确 ， 谁 就 有 了 制胜 的 先 机 。 


1.3.3 ”信息 与 工业 


当今 ， 信 息 化 主导 着 全 球 工业 发 展 的 大 趋势 。 信 息 化 和 工业 化 存在 如 下 关系 : 一 方 
面 ， 工 业 化 是 信息 化 的 基础 ， 另 一 方面 ， 信 息 化 是 工业 化 的 发 展 引擎 和 动力 。 

从 产业 结构 变迁 看 ， 工 业 化 是 农业 主导 经 济 向 工业 主导 经 济 的 演变 过 程 ， 信 息 化 则 
是 工业 主导 经 济 向 信息 主导 经 济 的 演变 过 程 。 信 息 化 是 在 工业 化 的 基础 上 发 展 起 来 的 。 
作为 信息 化 基础 的 工业 化 ， 其 发 展 从 以 下 几 个 方面 为 信息 化 的 兴起 创造 了 条 件 。(1) 提 
供 物质 基础 。 信 息 化 需要 大 量 进行 信息 基础 设施 建设 、 发 展 信息 技术 装备 、 实 施 应 用 信 
息 工程 。 这 些 都 离 不 开 来 自 工业 的 钢铁 、 机 械 、 建 筑 、 电 力 等 方面 的 支撑 。(2) 扩大 市 
场 容 量 。 信 息 化 以 技术 信息 化 广泛 应 用 为 主导 、 以 信息 资源 开发 利用 为 核心 ， 以 信息 产 
业 成 长 壮大 为 支撑 ， 工 业 化 为 信息 产业 营造 了 服务 对 象 。(3) 集聚 建设 资金 。 进 行 信息 
化 建设 ， 需 要 投入 大 量 资金 ， 比 如 要 投资 信息 基础 设施 ， 要 投资 建设 信息 项 目 ， 创 建 信 
息 产 业 和 企业 也 要 资金 。 工 业 化 的 发 展 为 信息 化 积累 了 资金 ， 特 别 是 通过 工业 化 形成 的 
资本 市 场 及 其 金融 创新 ， 替 信息 化 开拓 了 多 种 融资 渠道 。(4) 输送 专业 人 才 。 信 息 化 所 
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需 的 人 才 ， 既 与 工业 化 需求 有 共同 之 处 ， 如 一 定 的 知识 水 平 ， 又 有 与 工业 化 的 需求 的 不 
同 之 处 ， 如 其 要 求 更 富 灵活 性 和 创造 性 。 

信息 化 是 工业 化 的 延伸 和 发 展 。 工 业 化 培育 了 信息 化 ， 而 信息 化 发 展 了 工业 化 ， 信 
息 化 对 工业 化 的 发 展 可 概括 为 以 下 几 个 方面 。(1) 信息 技术 改造 和 提升 了 传统 工业 ， 特 
别 是 传统 制造 业 。 传 统 的 制造 业 通 过 采用 新 型 的 信息 技术 可 以 很 好 地 提高 自己 的 生产 效 
率 以 达到 重新 发 展 的 目的 。(2) 提高 工业 的 整体 素质 和 过 激 竞争 力 。(3) 帮助 工业 企业 
降低 成 本 、 提 高 效率 、 减 少 污染 、 增 加 商机 。 此 外 ， 信 息 化 对 工业 有 以 下 三 种 作用 。 一 
是 补充 作用 。 信 息 经 济 越发 展 ， 越 能 弥补 工业 经 济 的 不 足 ， 如 提高 能 耗 效率 。 二 是 将 代 
作用 。 信 息 经 济 越发 展 ， 越 能 用 信息 资源 来 替代 更 大 一 部 分 的 物质 资源 和 能 量 资源 。 三 
是 带动 作用 ， 信 息 经 济 越发 展 ， 越 能 使 工业 经 济 的 发 展 有 机 会 和 新 途径 ， 信 息 化 可 以 带 
动工 业 化 ， 从 而 实现 生产 力 的 跨越 式 发 展 。 

信息 化 时 代 的 世界 已 成 为 一 个 地 球 村 。 信 息 化 技术 让 人 类 突破 了 传统 的 时 空 界限 ， 
以 及 物流 、 信 息 流 、 知 识 流 的 限制 ， 实 现 了 全 球 的 互通 。 以 产品 生产 为 例 ， 一 些 工业 产 
品 的 生产 已 经 突破 地 域 限制 ， 实 现 多 个 国家 之 间 的 紧密 合作 ， 发 挥 各 个 国家 和 地 区 的 技 
术 、 劳 动力 成 本 等 方面 的 优势 ， 最 终生 产 出 国际 性 的 产品 。 例 如 ， 波 音 747 飞机 共 由 45 
万 个 零件 组 成 , 他 们 由 6 个 国家 的 1100 家 大 型 企业 和 15000 家 小 企业 所 生产 , 其 中 包括 
西安 生产 的 飞机 尾翼 。 


1.3.4 ”信息 与 社会 


言 县 对 当代 社会 有 着 深远 的 影响 。 信息 社 会 也 称 为 信息 化 社会 , 是 工业 化 社会 之 后 ， 
信息 将 起 主要 作用 的 社会 。“ 信 息 化 ”的 概念 在 20 世纪 60 年 代 初 提出 。 一 般 认为 , 信息 
化 是 指 信息 技术 和 信息 产业 在 经 济 和 社会 发 展 中 作用 日 益 加 强 ， 并 发 挥 主导 作用 的 动态 
发 展 过 程 。 它 以 信息 产业 在 国民 经 济 中 的 比重 、 信 息 技术 在 传统 产业 中 的 应 用 程度 和 信 
息 基 础 设施 建设 水 平 为 主要 标志 。 

从 内 容 上 看 ， 信 息 化 可 分 为 信息 的 生产 、 应 用 和 保障 三 大 方面 。 

(1) 信息 生产 ， 即 信息 产业 化 ， 要 求 发 展 一 系列 信息 技术 及 产业 ， 涉 及 信息 和 数 
据 的 采集 、 处 理 、 存 储 技术 ,包括 通信 设备 、 计 算 机 、 软 件 和 消费 类 电子 产品 制造 等 
领域 。 

(2) 信息 应 用 ， 即 产业 和 社会 领域 的 信息 化 ， 主 要 表现 在 利用 信息 技术 改造 和 提升 
农业 、 制 造 业 、 服 务 业 等 传统 产业 ， 大 大 提高 各 种 物质 和 能 量 资源 的 利用 效率 ， 促 使 闫 
业 结 构 的 调整 、 转 换 和 升级 ， 促 进入 类 生活 方式 、 社 会 体系 和 社会 文化 发 生 深刻 变革 。 

(3) 信息 保障 ， 指 保障 信息 传输 的 基础 设施 和 安全 机 制 ， 使 人 类 能 够 可 持续 地 提升 
获取 信息 的 能 力 ， 包 括 基 础 设施 建设 、 信 息 安全 保障 机 制 、 信 息 科技 创新 体系 、 信 息 传 
播 途 径 和 信息 能 力 教育 等 。 
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1.4 信息 生命 周期 管理 


信息 是 一 种 具有 生命 周期 的 资源 ， 信 息 生命 周期 是 信息 运动 的 自然 规律 ， 信 息 会 随 
着 所 处 生命 周期 的 不 同 阶 段 而 起 起 落落 。 在 信息 生命 周期 基础 上 衍生 出 来 的 信息 生命 周 
期 管理 (Information Lifecycle Management，ILM) 不 仅 是 一 种 信息 管理 策略 ， 而 且 是 
一 种 结合 了 人 员 、 流 程 和 技术 ， 则 在 有 效 管理 数据 和 信息 的 战略 ~ 。 信 息 生 命 周 期 管 
理 是 一 种 主动 管理 信息 的 策略 过 程 ， 对 信息 的 所 有 生命 阶段 进行 管理 ， 目 的 在 于 能 在 信 
息 生 命 周期 的 各 个 阶段 以 最 低 成 本 获得 最 大 价值 。 

有 具体 来 说 ， 信 息 生 命 周期 管理 从 信息 产生 、 保 护 、 读 取 、 更 改 、 迁 移 、 存 档 、 再 次 
激活 ， 到 消失 不 再 有 利用 价值 、 不 再 被 传播 ) 这 些 阶段 对 信息 进行 综合 管理 。 与 早期 
的 数据 储存 管理 方法 不 同 ， 信 息 生 命 周期 管理 技术 根据 用 户 的 操作 全 方位 地 对 数据 进行 
管理 ， 而 不 仅仅 是 让 数据 储存 流程 自动 化 。 例 如 ， 信 息 生 命 周期 管理 可 以 根据 各 项 数据 
标准 自动 把 数据 归 到 速度 不 同 的 存储 媒体 上 ， 并 且 自 动 完成 数据 在 各 层 〈 如 高 性 能 层 、 
性 能 层 、 容 量 层 ) 之 间 的 移动 。 一 般 管理 规则 就 是 把 新 数据 和 常用 数据 放 在 速度 比较 快 、 
比较 好 的 储存 媒体 上 ， 而 不 重要 的 数据 就 放 在 速度 较 慢 、 比 较 便 宜 的 存储 介质 上 。 不 过 ， 
该 管理 系统 在 界定 数据 的 重要 性 时 并 不 仅仅 根据 数据 的 使 用 年 限 和 常用 性 ， 用 户 可 以 
自己 制订 规则 ， 调 整数 据 在 不 同时 期 的 重要 性 ， 并 通过 延长 它 的 使 用 周期 来 保持 它 的 
重要 性 。 

信息 在 存储 介质 或 网 络 中 的 流动 构成 了 信息 生命 周期 ， 图 1-4 所 示 为 企业 信息 流动 
过 程 。 一 笔 业 务 信息 从 客户 订单 下 达 时 就 产生 了 ， 此 时 的 信息 拥有 的 价值 较 高 ， 许 多 相 
关 部 门 的 人 员 都 要 对 信息 进行 存 取 和 处 理 ， 当 一 个 订单 完成 以 后 ， 该 笔 信 息 的 价值 开始 
逐渐 下 降 ， 此 时 将 它 转 存 到 低 成 本 的 存储 介质 中 可 以 节约 成 本 。 而 当 该 笔 业 务 出 现 后 续 
服务 问题 ， 比 如 质量 、 咨 询 和 改进 等 ， 企 业 又 需要 该 业务 的 信息 ， 把 它 重 新 激活 ， 提 取 
到 高 效 设 备 中 。 随 着 质量 保证 期 期 满 ， 这 一 信息 的 价值 又 重新 下 降 ， 直 到 一 定时 间 以 后 ， 
退出 它 的 生命 周期 。 

在 进行 信息 生命 周期 管理 时 , 除了 关注 信息 的 流动 性 , 还 要 进行 信息 的 保存 和 备份 。 
一 方面 ， 不 能 因为 信息 进入 “消亡 /退出 ”这 一 生命 阶段 就 将 其 删除 ， 信 息 的 保存 需要 符 
合法 律 和 法 规 的 要 求 。 随 着 信息 化 的 普遍 应 用 ， 企 业 各 方面 的 信息 都 开始 进入 电子 化 。 
国家 对 于 企业 信息 ,特别 是 财务 信息 等 重要 信息 ,都 有 法 规 要 求 。 一些 国家 的 重点 行业 ， 
如 金融 ， 电 信和 政府 部 门 等 ， 对 信息 的 保存 时 间 有 专门 的 规定 。 

另 一 方面 是 信息 的 灾难 恢复 。 当 不 可 抗力 的 情况 发 生 时 ， 会 对 信息 造成 无 法 挽回 的 
损失 。 如 果 企 业 重 要 的 业务 数据 丢失 ， 那 么 对 企业 造成 的 损失 就 不 仅仅 是 数据 本 身 ， 还 
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有 商业 机 会 的 可 能 丧失 ， 客 户 服务 水 平 的 下 降 。 从 小 的 方面 说 ， 个 别 硬件 系统 的 意外 和 
不 稳定 同样 会 对 企业 重要 信息 造成 破坏 ， 给 企业 造成 难以 弥补 的 损失 。 


Pe 高 价值 信息 
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图 1-4 企业 信息 管理 周期 





上 面 阐述 了 信息 的 重要 性 。 当 今 社 会 已 经 步 入 信息 化 时 代 ， 信 息 技 术 渗 透 到 人 类 社 
会 生活 的 方方面面 。 在 信息 技术 革命 推动 的 全 球 信 息 化 浪潮 中 ， 信 息 已 成 为 第 一 生产 要 
素 ， 是 构成 信息 化 社会 的 重要 技术 基础 。 下 面 分 述 信息 数据 量 的 增长 趋势 ， 以 及 信息 存 
储 系统 面临 的 技术 挑战 。 


1.5.1 数字 信息 的 增长 


1. 网络 化 助 推 数字 化 信息 快速 增长 

网 络 信息 资源 是 指 通过 计算 机 网 络 可 以 利用 的 各 种 信息 资源 的 总 和 。 有 具体 地 讲 ， 网 
络 信息 资源 是 指 所 有 以 电子 数据 形式 把 文字 、 图 像 、 声 音 、 动 画 等 多 种 类 型 的 信息 存储 
在 光 、 磁 等 非 纸 质 介质 的 载体 中 ， 并 通过 网 络 通信 终端 计算 机 或 其 他 终端 等 方式 再 现 
出 来 的 资源 。 
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信息 在 流动 中 实现 其 自身 的 价值 。 网 络 是 信息 流动 的 重要 媒介 。 早 在 网 络 体系 建立 
之 前 ;信息 就 已 经 存在 于 物质 世界 并 被 人 们 初步 运用 , 但 是 信息 的 大 规模 开发 利用 有 赖 于 
“网 络 化 ” 报纸 、 广 播 和 电视 是 三 大 传统 媒体 。 随 着 现代 科技 的 发 展 ， 特 别 是 进入 20 世 
纪 90 年 代 以 后 ， 新 兴 的 媒体 种 类 不 断 涌现 ， 第 四 媒体 一 一 网 络 媒 体 、 第 五 媒体 一 一 网 络 
电视 以 及 第 六 媒体 一 一 手机 及 其 无 线 增值 服务 等 登 上 舞台 ， 三 大 传统 媒体 一 统 天 下 的 格 
局 已 经 不 复 存在 。 

进入 20 世纪 90 年 代 ， 信 息 量 以 几何 级 别 增长 ， 到 20 世纪 90 年 代 末 ， 伴 随 着 互联 
网 的 出 现 ， 信 息 更 是 增长 到 难以 想象 的 地 步 ， 原 因 在 于 互联 网 让 信息 的 产生 和 传播 变 得 
简单 。 目 前 ， 互 联网 已 经 成 为 信息 社会 必 不 可 少 的 基础 设施 ， 借 助 互 联网 ， 信 息 采 集 、 
传播 的 速度 和 规模 达到 空前 的 水 平 ， 并 实现 了 全 球 信息 共享 与 交互 。 另 外 ， 现 代 通 信和 
传播 技术 也 大 大 提高 了 信息 传播 的 速度 和 广度 。 

图 1-5 所 示 为 Excelcom 公司 发 布 的 一 份 “ 互 联网 一 分 钟 产 生 数 据 ” 的 图 表 。 以 上 
列 出 的 仅仅 是 一 些 比较 知名 的 美国 互联 网 公司 ， 如 果 再 加 上 其 他 国家 的 网 络 服务 ， 数 据 
将 会 更 大 。 以 中 国 为 例 ，2016 年 ， 全 球 网 民 数 量 超过 30 亿 ， 中 国 以 7. 31 亿 的 网 民 数 量 
成 为 全 球 最 大 的 互联 网 市 场 ， 在 中 国 ， 每 天 有 上 亿 人 登录 微 信 ， 百 度 每 天 收 到 的 搜索 请 
求 超过 60 亿 次 等 。 








2. 科技 让 信息 产生 变 得 容易 

截至 2003 年 ， 人 类 共 创 造 出 5EB 的 数据 ， 而 2011 年 产生 如 此 多 的 信息 量 只 需要 不 
到 2 天 ，2013 年 产生 此 数据 量 只 需要 10 分 钟 ， 预 计 到 2020 年 ， 每 年 创造 的 数据 容量 将 
高 达 40ZB( 注 ，12B=10”Byte) “"。 信 息 数 据 量 快速 增长 是 信息 技术 发 展 的 必然 结果 ， 
下 面 列 出 儿 个 重要 因素 。 

(1) 智能 终端 普及 。 过 去 儿 年 ， 智 能 手机 、 平 板 电 脑 、 摄 像 机 、 照 相机 等 终端 设备 
不 断 充斥 着 人 们 的 生活 和 工作 。 据 统计 ， 目 前 世界 上 有 60 亿 部 手机 在 使 用 ， 手 机 基本 上 
都 内 置 了 高 分 辨 率 的 摄像 状 ， 单 张 照片 的 分 辩 率 是 5 年 前 的 10 倍 。 借 助 智能 手机 的 音 视 
频 硬件 ， 人 们 创建 了 越 来 越 多 的 社交 媒体 数据 , 例如 与 他 和 分享 图 片 、 音 频 、 视 频 等 文件 。 

(2) 物 联 网 飞速 发 展 。 国 内 外 物 联网 产业 快速 发 展 ， 并 逐步 成 为 新 兴 产 业 发 展 的 重 
要 领域 ”。 物 联网 将 世界 上 越 来 越 多 的 智能 设备 连接 到 全 球 网 络 中 ， 例 如 大 量 的 网 络 摄 
像 头 、 医 疗 保健 /健身 可 穿戴 设备 等 。 未 来 将 会 出 现 更 多 的 智能 设备 ， 如 智能 家 电 、 车 载 
设备 、 工 业 领 域 的 RFID 系统 等 。 可 以 预计 , 在 不 远 的 将 来 , 物 联 网 会 产生 出 更 多 的 数据 。 

(3) 互联 网 和 高 速 宽带 。 在 科技 史上 ， 互 联网 可 以 和 “ 火 ” 与 “ 电 ” 的 发 明 相 媲美 ， 
互联 网 将 孤立 的 计算 机 连接 起 来 ， 改 变 了 人 们 生活 ， 成 为 人 们 获取 数据 的 首要 渠道 ， 也 
成 为 人 们 共享 数据 的 重要 途径 。 另 外 ， 传 输 数 据 的 网 络 在 持续 不 断 地 升级 ， 客 观 上 加 速 
了 数据 量 的 增长 ， 比 如 ， 现 在 每 个 人 都 习惯 用 宽带 上 网 ，46 无 线 网 络 已 经 广泛 使 用 ， 共 
享 数据 变 得 快速 而 方便 。 

(4) 云 计 算 。 在 云 计算 出 现 之 前 ， 数 据 大 多 分 散 存 储 在 个 人 电脑 或 公司 服务 器 中 ， 
云 计算 的 出 现 改 变 了 数据 的 存储 和 访问 方式 ， 使 绝 大 部 分 数据 被 集中 存储 到 “数据 中 
心 ” 即 所 谓 的 “云端 ” 各 大 银行 、 大 型 互联 网 公司 、 电 信行 业 都 拥有 各 自 的 数据 中 心 ， 
实现 了 全 国 级 数据 访问 和 管理 ”。 云 计算 客观 上 为 大 数据 提供 了 存储 空间 和 访问 渠道 。 

(5) 社交 网 络 。 社 交 媒 体 的 兴起 是 互联 网 发 展 史 上 一 个 重要 里 程 碑 ， 它 将 人 类 社会 
真实 的 人 际 关系 完美 地 映射 到 互联 网 空间 。 例 如 ， 通 过 社交 网 络 ， 人 们 可 以 分 享 各 自 的 
喜人 经 哀乐 ， 并 相互 传播 。 知 名 的 社交 媒体 有 微 博 、 微 信 、Facebook 等 。 


1.5.2 ”信息 存储 的 载体 


信息 载体 (Carrier) 是 信息 传播 中 携带 信息 的 媒介 ， 是 信息 赖 以 附 载 的 物质 基础 ， 
即 用 于 记录 、 传 输 、 积 累 和 保存 信息 的 实体 。 信 息 载 体 包括 运用 声波 、 光 波 、 电 波 传递 
信息 的 无 形 载 体 和 运用 纸张 、 胶 卷 、 胶 片 、 磁 带 、 磁 盘 、 光 盘 传 递 和 记载 信息 的 有 形 载 
体 。 信 息 本 身 不 是 实体 ， 但 消息 、 情 报 、 指 令 、 数 据 和 信和 号 中 所 包含 的 内 容 ， 必 须 依 靠 
某 种 媒介 进行 传递 。 信 息 载 体 的 演变 推动 着 人 类 信息 活动 的 发 展 。 从 某 种 意义 上 说 ， 传 
播 信 号 革命 就 是 信息 载体 的 革命 。 

人 类 在 原始 时 代 就 开始 使 用 语言 ， 语 言 是 人 类 传递 信息 的 第 一 载体 ， 是 社会 交际 、 
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交流 思想 的 工具 ， 是 人 类 社会 中 最 方便 、 最 复杂 、 最 通用 、 最 重要 的 信息 载体 。 随 着 生 
产 的 发 展 和 社会 的 不 断 进步 ， 出 现 了 信息 的 第 二 载体 ， 即 文字 。 世 界 上 有 500 多 种 文字 
在 使 用 。 文 字 的 发 明 ， 为 信息 的 记载 和 远 距离 传递 提供 了 可 能 ， 是 人 类 的 一 大 进步 。 电 
人 磁 波 和 电信 号 成 为 人 类 的 第 三 信息 载体 , 使 大 量 信息 以 光 的 速度 传递 , 沟通 了 整个 世界 ， 
使 人 类 信息 活动 进入 了 新 纪元 。 

随 着 信息 量 的 剧 增 ,， 信息 广 泛 交 流 需要 容量 更 大 的 信息 载体 。 计 算 机 、 光 纤 、 通 信 
卫星 等 新 的 信息 运载 工具 成 为 新 技术 形势 下 主要 的 信息 载体 。 一 根 头 发 丝 粗细 的 光纤 可 
以 同时 传输 几 十 万 路 电话 或 上 千 路 电视 。 卫 星 通信 可 把 信息 送 到 世界 任何 一 个 角落 。 新 
的 信息 载体 可 能 会 带 来 新 的 信息 革命 。 比 如 ， 报 纸 是 信息 载体 ， 报 纸 上 刊 登 的 文字 是 信 
息 ; 照片 是 信息 载体 ， 照 片 存储 的 模拟 图 像 是 信息 ; 磁带 是 信息 载体 ， 磁 带 录 音 记录 是 
信息 ;电视 是 信息 载体 ， 电 视 上 播 出 的 画面 声音 是 信息 。 从 报纸 到 电视 的 变革 ， 使 信息 
从 枯燥 的 文字 演变 为 声 情 并 成 的 画面 和 声音 。 

信息 的 存储 是 信息 在 一 定 的 时 间 范 围 内 得 以 顺利 传输 的 基础 ， 也 是 信息 得 以 进一步 
综合 、 加 工 、 积 累 和 创造 的 基础 ， 在 人 类 和 社会 发 展 中 有 重要 意义 。 造 纸 术 、 印 刷 术 、 
摄影 、 摄 像 技 术 、 录 音 、 录 像 技术 以 及 磁盘 、 人 磁带、 光盘 等 都 是 信息 存储 驱动 而 产生 的 
技术 。 这 些 人 造 的 信息 存储 技术 与 设备 不 仅 在 存储 容量 、 存 取 速 度 方面 扩大 着 人 脑 存储 
外 力 ， 而 且 让 信息 交流 超越 时 间 和 地 域 的 限制 。(1) 把 人 主观 认识 世界 的 信息 迁移 到 客 
观 世 界 的 存储 介质 中 ， 可 以 不 受 死亡 的 限制 而 代 代 相传 。(2) 将 人 大 脑 的 知识 变 为 人 类 
社会 共享 的 知识 ， 不 同 地 域 的 人 们 可 以 进行 信息 交流 。 

存储 系统 是 计算 机 系统 中 由 存放 程序 和 数据 的 各 种 存储 设备 、 控 制 部 件 〈 硬 件 ) 及 
管理 信息 调度 的 算法 (软件 ) 所 组 成 的 系统 。 计 算 机 的 主 存 储 器 不 能 同时 满足 存 取 速度 
快 、 存 储 容量 大 和 成 本 低 的 要 求 ， 在 计算 机 中 必须 有 速度 由 慢 到 快 、 容 量 由 大 到 小 的 多 
层级 存储 器 ， 以 最 优 的 控制 调度 算法 和 合理 的 成 本 ， 实 现 性 能 可 接受 的 存储 系统 。 


1.5.3 ”存储 系统 的 发 展 


如 前 文 所 述 ， 数 据 是 信息 的 具体 表现 形式 。 数 据 存在 于 全 球 经 济 的 每 一 个 部 门 ， 如 
同 固定 资产 和 人 力 资 本 等 生产 要 素 一 样 ， 时 刻 推 动 着 现代 经 济 活动 。 另 外 , 现在 社会 中 ， 
决定 产业 兴衰 的 已 经 不 仅仅 是 土地 、 劳 动力 、 技 术 、 资 本 、 管 理 等 生产 要 素 ， 还 包括 数 
据 资产 这 一 根本 性 要 素 。 

数据 量 的 增长 速度 超 乎 想象 ,“ 怎 样 安全 地 、 可 靠 地 保存 这 些 不 断 增 长 的 数据 ”是 
存储 系统 设计 面临 的 一 个 挑战 。 为 了 应 对 这 个 挑战 ， 按 照 见 余 放置 、 分 散布 局 等 方法 来 
组 织 和 管理 存储 数据 ， 已 成 为 构建 高 性 能 、 大 容量 、 高 可 用 性 存储 系统 的 一 种 技术 趋势 。 
下 面 介绍 两 个 案例 。(1) 主机 内 空间 限制 导致 硬盘 容量 扩展 和 利用 率 受 到 限制 ， 主 机 硬 
盘 的 容量 扩展 性 和 空间 利用 率 受到 限制 ， 影 响 系统 整体 性 能 的 提升 ， 磁 盘 阵 列 技术 的 出 
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现 很 好 地 解决 了 这 一 不 足 ， 其 通过 使 用 多 磁盘 并 行 存 取 数据 来 大 幅 提 高 数据 吞吐 率 ; 通 
过 数据 校 验 来 支持 容错 功能 ， 提 高 存储 数据 的 可 用 性 ; (2) 分 布 式 存储 系统 在 系统 层面 
采用 高 速 网 络 技术 连接 多 个 存储 设备 或 者 存储 节点 ， 并 融合 多 种 存储 技术 , 如 负载 均衡 、 
副本 元 余 等 ， 从 而 为 大 数据 、 云 计算 、 电 子 商务 等 新 兴 应 用 领域 提供 高 可 管理 性 、 高 可 
扩展 性 、 高 可 靠 性 的 存储 解决 方案 。 

1. 阵列 存储 

人 磁盘 阵列 (RAID) 是 由 多 个 独立 的 高 性 能 磁盘 驱动 器 组 成 的 磁盘 子 系统 ， 可 以 提供 
比 单个 磁盘 更 好 的 存储 性 能 和 数据 保护 。RAID 包括 多 个 级 别 ， 如 ，RAID 0、RAID 1、RAID 
3、RAID 5、RAID 6、RAID 10、RAID 50 等 ， 如 图 1-6 所 示 ， 不 同 RAID 级 别 在 成 本 、 性 
能 和 可 靠 性 上 有 所 区 别 。 本 书 第 4 章 和 第 5 章 将 对 RAID 技术 进行 详细 介绍 。 





图 1-6 不 同 RAID 级 别 在 成 本 、 性 能 和 可 靠 性 上 的 表现 


RAID 存储 应 用 广泛 , 可 以 满足 许多 数据 存储 需求 , 其 主要 优势 体现 在 以 下 几 个 方面 。 

(1) 大 容量 。RAID 扩大 了 磁盘 的 容量 ， 由 多 个 磁盘 组 成 的 RAID 系统 具有 更 大 的 存 
储 空间 。 现 在 单个 磁盘 的 容量 就 可 以 到 1TB 以 上 ， 这 样 RAID 的 存储 容量 就 可 以 达到 PB 
级 ， 可 以 满足 大 多 数 的 存储 需求 。 一 般 来 说 ，RAID 可 用 容量 要 小 于 所 有 成 员 磁 盘 的 总 容 
量 。 不 同等 级 的 RAID 算法 需要 一 定 的 见 余 开销 ， 具 体 容量 开销 与 采用 算法 相关 。 如 果 已 知 
RAID 算法 和 容量 ， 可 以 计算 出 RAID 的 可 用 容量 。 通 常 ，RAID 容量 利用 率 在 50% 一 90%。 

(2) 高 性 能 。RAID 的 高 性 能 受益 于 数据 条 带 化 技术 。 单个 磁盘 的 IZ0 性 能 受到 接口 、 
带宽 等 计算 机 技术 的 限制 ， 往 往 很 有 限 ， 容 易 成 为 系统 性 能 的 瓶颈 。 通 过 数据 条 带 化 ， 
RAID 将 数据 1/0 分 散 到 各 个 成 员 磁 盘 上 ， 从 而 获得 比 单个 磁盘 更 好 的 聚合 1/0 性 能 。 

(3) 可 靠 性 。 从 理论 上 讲 ， 由 多 个 磁盘 组 成 的 RAID 系统 在 可 靠 性 方面 应 该 比 单个 磁盘 
要 差 。 这 里 有 个 隐 含 假定 : 单个 磁盘 故障 将 导致 整个 RAID 不 可 用 。RAID 采用 镜像 和 数据 校 
验 等 数据 元 余 技术 ,打破 了 这 个 假定 。 镜 像 是 最 为 原始 的 元 余 技 术 ， 把 某 组 磁盘 驱动 器 上 的 
数据 完全 复制 到 另 一 组 磁盘 驱动 器 上 ， 保 证 总 有 数据 副本 可 用 。 比 起 镜像 50% 的 元 余 开 销 ， 
数据 校 验 要 小 很 多 ,， 它 利用 校 验 兄 余 信 息 对 数据 进行 校 验 和 纠 错 。RAID 宛 余 技术 大 幅 提升 数 
据 可 用 性 和 可 靠 性 ， 保 证 了 若干 磁盘 出 错时 ， 不 会 导致 数据 的 丢失 , 不 影响 业务 的 连续 运行 。 

(4) 可 管理 性 。RAID 是 一 种 虚拟 化 技术 ， 它 将 多 个 物理 磁盘 驱动 器 虚拟 成 一 个 大 容 
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量 的 逻辑 驱动 器 。 对 于 外 部 主机 系统 来 说 ，RAID 是 一 个 单一 的 、 快 速 可 靠 的 大 容量 磁盘 
驱动 器 。 这 样 ， 用 户 就 可 以 在 这 个 虚拟 驱动 器 上 组 织 和 存储 应 用 系统 数据 。 从 用 户 应 用 
角度 看 ， 这 样 的 存储 系统 简单 易 用 ,管理 也 很 便利 。 由 于 RAID 内 部 完成 了 大 量 的 存储 管 
理工 作 , 管理 员 只 需要 管理 单个 虚拟 驱动 器 , 因此 可 以 节省 大 量 的 管理 工作 。 男 外 ,RAID 
可 以 动态 增 减 磁盘 驱动 器 ， 可 自动 进行 数据 重建 恢复 。 

2. 数据 中 心 存储 

Facebook 的 全 球 用 户 总 数 已 经 超过 15 亿 ， 其 每 天 处 理 来 自 全 球 的 3. 5 亿 张 照片 、 
45 亿 个 “点 赞 ” 和 100 亿 条 消息 ， 这 意味 着 Facebook 需要 为 此 配备 巨大 的 基础 设施 来 
处 理 和 存储 这 些 海量 信息 。 为 了 存储 海量 数据 ，Facebook 数据 中 心 通常 部 署 几 万 甚至 十 
几 万 台 服 务 器 ; 为 了 应 对 快速 的 数据 增长 速度 ， Facebook 数据 中 心 的 存储 架构 和 网 络 架 
构 是 高 可 扩展 的 。 

对 于 存储 架构 ，Facebook 设计 了 几 个 存储 系统 。(1) 针对 小 文件 的 海量 图 片 存储 系 
统 Haystack”"，Haystack 包含 三 个 核心 组 件 : Haystack Store、Haystack Directory 
和 Haystack Cache。Haystack Store 用 于 持久 存储 图 片 数据 和 图 片 元 数据 ;Haystack 
Directory 用 于 维护 逻辑 到 物理 卷 的 英 射 ， Haystack Cache 缓存 热门 图 片 ， 尽 量 避 免 
访问 Haystack Store。(2) Facebook 部 署 了 针对 大 文件 的 高 可 靠 文件 系统 HDFS， 
Facebook HDFS 可 以 管理 几 千 存储 节点 上 儿 亿 个 文件 和 数据 块 ， 具 有 良好 的 可 扩展 性 ”。 
(3) Facebook HBase 是 一 种 构建 在 HDFS 之 上 的 面向 列队 分 布 式 存储 系统 ， 可 以 提供 实 
时 计算 的 分 布 式 数 据 库 管理 ， 其 针对 的 是 实时 读 写 、 随 机 访问 的 超大 规模 数据 集 ”。 

对 于 网 络 架构 ，Facebook 的 设计 宗旨 是 高 可 扩展 性 、 高 性 能 和 高 可 靠 性 ， 并 要 求 该 
网 络 架构 能 快速 地 扩展 规模 和 性 能 。 为 了 达到 这 个 目的 ，Facebook 将 网 络 分 解 成 为 小 的 
单元 一 server pod，pod 直接 全 互联 。 如 图 1-7 所 示 ， 一 个 pod 里 面 最 多 有 48 个 机 架 ， 
每 个 机 架 和 4 个 fabric 交换 机 相连 ， 每 个 机 架 交 换 机 有 4X40Gbit/s 总 共 160Gbit/s 
的 出 口 带宽 ， 机 架 内 部 的 服务 器 之 间 10Gbit/s 互联 。 


#4 个 fabric 交换 机 
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48 个 TOR 交换 机 
图 1-7 Facebook 数据 中 心 架构 
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如 图 1-8 所 示 ，pod 之 间 的 互联 依靠 spine 交换 机 ， 每 个 spine 平面 最 多 有 48 个 独 
并 的 spine 交换 机 ，pod 之 间 形 成 一 个 高 性 能 的 全 互联 网 络 ， 另 外 ，edge 平面 的 交换 机 
负责 出 口 流量 。 所 有 机 架 之 间 存 在 多 种 路 径 ， 交 换 机 根据 流量 自动 选择 路 径 ， 因 此 能 够 
容 妨 若干 网 络 路 径 的 故障 ，。 





oa 





图 1-8 Pod 互连网 络 


图 1-9 所 示 为 Facebook 数据 中 心 下 的 一 组 服务 器 机 哥 ， 每 台 机 架 部 署 十 几 台 服务 器 。 
NY a 
人 全 SS Se/ 


图 1-9 Facepook 数据 中 心 
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1.6 本章 小 结 


当今 社会 已 经 成 为 一 个 信息 化 社会 ， 信 息 无 处 不 在 、 无 时 不 在 。 通 常 来 说 ， 生 产 要 
素 包 含 土地 、 劳 动力 、 资 本 ,管理 、 信 息 、 技 术 。 在 过 去 ， 土 地 、 劳 动 和 资本 这 些 资源 
对 于 人 们 的 经 济 活动 和 社会 活动 显得 相对 比较 重要 ， 而 如 今 ， 信 息 、 管 理 和 技术 这 些 资 
源 已 上 升 到 比较 重要 的 位 置 。 人 类 活动 已 经 离 不 开 信息 ， 大 到 国家 、 中 到 企业 、 小 到 个 
人 ， 信 息 已 成 为 决策 的 重要 依据 。 鉴 于 信息 的 重要 性 ， 收 集 信息 、 保 存 信息 、 检 索 信息 
的 存储 系统 也 就 成 为 重 中 之 重 ， 特 别 是 信息 数据 量 呈 爆炸 式 增长 态势 ， 存 储 系统 面临 容 
量 可 扩展 性 、 性 能 可 扩展 性 、 易 管理 性 、 安 全 性 等 挑战 。 


练习 题 
选择 题 
1. 下 列 选 项 中 属于 信息 表现 形式 的 是 〈 ) 
A. 书 B. 文字 C. 光盘 D. 网 络 


2. 将 几 幅 看 似 无 关 的 旧 照 片 通过 图 像 处 理 软件 (如 Photoshop〉 加 工 后 ， 形 成 一 幅 
富有 创意 、 有 实际 用 途 的 图 片 ， 这 体现 了 信息 是 ( ) 


A. 需 依附 一 定 载 体 的 B. 可 以 共享 的 

C. 可 以 加 工 的 D. 具有 时 效 性 的 

3. 下 列 选 项 ， 不 能 称 为 信息 的 是 ( ) 

A. 报 上 登载 “ 神 七 成 功 进 行 出 舱 活 动 ”的 消息 

B. 高 中 信息 技术 (选修 ) 课本 

C. 电视 中 播 出 的 奥运 会 各 国人 金牌 数 

D. 高 中 信息 技术 水 平 测试 成 绩 

4. 以 下 选项 中 应 用 了 信息 技术 的 有 ( ) 

A. 数码 电影 B， 电子 商务 C. 智能 家 电 D. 排 爆 机 器 人 

5. 在 信息 技术 的 发 展 史 上 ， 首 先 使 信息 存储 和 传递 超越 了 时 间 和 地 域 局 限 的 标记 
是 ( ) 

A. 语言 的 使 用 B. 文字 的 创造 

C. 电报 电话 的 发 明 D. 计算 机 网 络 技 术 的 普及 
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2.1 IT 系统 介绍 
2.2 存储 系统 
2.3 ”基本 存储 设备 
2.4 存储 虚拟 化 
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在 著作 《The World Is Flat》 中 , 美国 作家 托马斯 * 弗 里 德 曼 (Thomas L. Friedman) 
阐述 了 一 个 观点 : 21 世纪 以 来 ， 信 息 技术 的 不 断 进 步 加 速 了 全 球 化 进程 。 随 着 信息 化 程 
度 的 不 断 提 高 , 人 们 的 生活 已 经 和 信息 技术 密 不 可 分 。 信 息 进行 传输 和 处 理 可 称 为 “ 动 ”， 
诚然 ， 有 “ 动 ” 必 有 “ 静 ” 信息 保存 在 存储 介质 可 称 为 “ 静 ”。 本 章 将 对 存储 系统 进行 
详细 的 介绍 。 

。 了 解 IT 系统 的 资源 组 成 ; 

站 3。 了解 存储 系统 的 物理 组 成 和 逻辑 结构 ; 
3。 了 解 机 械 硬 盘 和 固态 硬盘 的 结构 及 原理 ; 
>。 了解 存 储 庶 拟 化 概念 . 


ye 


对 中 
-0 


nn 





现代 通信 与 计算 机 技术 的 发 展 ， 使 信息 系统 (Information System) 的 处 理 能 力 得 
到 很 大 的 提高 。 现 在 各 种 信息 系统 已 经 离 不 开 现代 通信 与 计算 机 技术 ， 我 们 现在 所 说 的 
信息 系统 一 般 均 指 人 、 机 共存 的 系统 ， 是 由 计算 机 硬件 、 网 络 和 通讯 设备 、 计 算 机 软件 、 
信息 资源 、 信 息 用 户 和 规章 制度 组 成 的 以 处 理 信息 流 为 目的 的 人 机 一 体 化 系统 。 随 着 大 
型 计算 能 力 、 海 量 数据 存储 的 发 展 ， 信 息 系 统 对 计算 能 力 、 数 据 存 储 资 源 方 面 都 有 更 
高 的 要 求 ， 独 立 的 计算 机 系统 已 经 很 难 满足 。 因 此 ， 就 需要 把 多 个 计算 机 系统 集成 起 
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来 ， 构 成 一 个 整体 的 IT 系统 。IT 系统 是 在 计算 机 系统 的 基础 上 所 进行 的 扩展 和 延伸 ， 
如 图 2-1 所 示 ，IT 系统 由 软件 资源 、 计 算 资 源 、 网 络 资源 和 存储 资源 组 成 。 





图 2-1 IT 系统 构成 


软件 资源 : IT 系统 的 软件 资源 不 再 是 独立 计算 机 系统 的 单一 操作 系统 (0perating 
System，0S)， 它 已 发 展 成 集群 软件 系统 、 分 布 式 文件 系统 等 ， 支 持 集群 业务 管理 和 分 布 
式 应 用 。 

计算 资源 : 在 IT 系统 中 ， 往 往 会 把 多 台 服 务 器 组 成 集群 ， 通 过 集群 方式 实现 计算 
资源 的 负载 均衡 ， 提 升 整体 计算 能 力 ; 同时 ， 提 高 系统 的 元 余 度 ， 保 证 系统 的 可 靠 性 。 

网 络 资源 : 从 独立 计算 机 系统 发 展 成 为 IT 系统 ， 需 要 强大 网 络 资源 提供 数据 通路 ， 
比较 常用 的 网 络 架构 包括 基于 TCP/IP 协议 的 IP 网 络 和 基于 FC 协议 的 FC 网 络 。 

存储 资源 ，IT 系统 对 存储 系统 提出 高 可 扩展 性 、 高 可 靠 性 要 求 ， 从 而 ， 外 部 存储 成 
为 主流 的 存储 资源 组 织 方式 ， 一 般 通 过 构建 专用 的 外 部 存储 系统 来 提供 安全 可 靠 的 大 容 
量 存储 空间 。 


2.1.1 软件 资源 


在 IT 基础 设施 中 ， 软 件 是 必 不 可 少 的 一 部 分 。 软 件 是 与 计算 机 系统 操作 有 关 的 计 
算 机 程序 、 规 程 、 规 则 ， 以 及 可 能 有 的 文件 、 文 档 及 数据 ， 是 一 系列 按照 特定 顺序 组 织 
的 计算 机 数据 和 指令 的 集合 。 软 件 不 仅 包括 运行 在 计算 机 上 的 程序 ， 还 包括 与 这 些 程序 
相关 的 文档 ， 简 言 之 ， 软 件 是 程序 与 文档 的 集合 体 。 如 图 2-2 所 示 ， 按 照 承载 关系 ， 从 
底层 重 件 到 上 层 应 用 ， 软 件 依次 可 以 分 为 : 硬件 底层 驱动 程序 、 操 作 系 统 、 数 据 库 、 应 
用 软件 。 
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便 件 底层 驱动 程序 是 应 用 软件 访问 底层 硬件 
的 接口 : 一 方面 , 应 用 软件 对 驱动 程序 发 送 指令 ， 
驱动 程序 将 它 翻译 成 硬件 控制 的 动作 指令 ; 另 一 
方面 ， 驱 动 程序 将 从 硬件 上 获得 的 数据 传送 给 应 
用 程序 ， 实 现 应 用 程序 与 驱动 程序 间 的 交互 。 也 
就 是 说 ， 硬 件 底层 驱动 实现 了 访问 底层 硬件 的 人 
机 交互 。 

操作 系统 是 管理 计算 机 硬件 与 软件 资源 的 计 
算 机 程序 ， 提 供 一 个 让 用 户 与 系统 交互 的 操作 界 
面 。 操 作 系统 需要 处 理 如 下 基本 事务 : 管理 与 配 
置 内 存 、 决 定 系统 资源 的 优先 次 序 、 控 制 1/0 设 人 
备 、 操 作 网 络 与 管理 文件 系统 等 。 目 前 ， 采 用 的 操作 系统 有 微软 Windows 操作 系统 、Linux 
操作 系统 、UNIX 操作 系统 、AIX 系统 等 。 

数据 库 是 按照 数据 结构 来 组 织 、 存 储 和 管理 数据 的 仓库 。 随 着 信息 技术 和 市 场 的 发 
展 ， 数 据 库 发 展 出 很 多 种 类 型 ， 包 括 最 简单 的 数据 表格 、 存 储 少量 数据 的 小 型 数据 库 、 
存储 海量 数据 的 大 型 数据 库 等 。 小 型 数据 库 系 统 有 Access、MySQL 等 ， 大 型 数据 库 系 统 
有 0racle、DB2、SQL 等 。 

应 用 软件 是 为 满足 用 户 不 同 领域 、 不 同业 务 的 应 用 需求 而 提供 的 上 层 软 件 。 它 可 以 拓 
宽 计 算 机 系统 的 应 用 领域 ， 放 大 硬件 的 功能 。 例 如 :， 办公 软 件 、E-mail 应 用 、 财 务 系统 等 。 


2.1.2 ”计算 资源 


IT 系统 中 的 计算 资源 ， 通 常 由 各 式 各 样 的 服务 器 构成 。 当 单个 的 服务 器 计算 能 力 不 
能 够 满足 应 用 需求 时 ， 通 常 采用 服务 器 集群 来 提供 更 大 计算 能 力 。 如 图 2-3 所 示 ， 人 常用 
服务 器 包括 塔 式 服 务 器 、 机 架 式 服务 器 和 刀片 式 服务 器 。 





塔 式 服务 器 





刀片 服务 器 
服务 器 集群 
图 2-3 服务 器 


第 2 章 存储 系统 介绍 








塔 式 服务 器 也 叫 通用 类 别 服务 器 ， 其 外 观 和 内 部 结构 与 普通 台式 PC 机 差不多 ， 整 
体 体积 比 PC 机 稍 大 一 些 , 它 的 外 形 尺 寸 没 有 相关 的 统一 标准 。 由 于 塔 式 服 务 器 的 机 箱 比 
较 大 ， 可 以 采用 高 档 配 置 和 元 余 配 置 。 塔 式 服务 器 支持 多 种 常见 的 服务 ， 应 用 范围 非常 
广 ， 可 以 适合 速度 应 用 和 存储 应 用 ， 是 目前 使 用 率 较 高 的 一 种 服务 器 。 塔 式 服务 器 的 缺 
点 是 它 体积 比较 大 ， 占 用 空间 多 ， 也 不 方便 管理 。 

机 架 式 服务 器 是 一 种 工业 标准 化 的 产品 ， 其 外 观 按照 统一 标准 来 设计 ， 配 合 机 柜 统 
一 使 用 ， 以 满足 企业 的 服务 器 密集 部 署 需求 "。 机 架 式 服务 器 是 市 面 上 使 用 最 多 的 服务 
器 平台 , 它 设计 之 初 的 目的 就 是 可 以 安装 到 19 英寸 标准 机 柜 中 , 多 台 机 架 服 务 器 能 够 装 
到 一 个 机 柜上 ， 这 与 塔 式 服务 器 不 同 ， 在 节省 空间 的 同时 ， 也 便于 统一 的 安装 和 管理 。 
机 架 服务 器 的 宽度 为 19 英寸 ， 高 度 有 1U、2U、3U、4 各 、5U、7U 儿 种 标准 的 服务 器 ， 这 
里 的 0 为 高 度 单位 (1U=1. 75 英寸 =44. 45 毫米 )。 最 常用 的 有 1U 和 2U。 机 架 式 服 务 器 也 存 
在 一 些 浆 端 ， 由 于 内 部 空间 有 限 ， 扩 展 性 和 散热 性 受 限制 ， 其 单机 系统 性 能 也 比较 有 限 ， 往 
往 应 用 于 特定 业务 ， 如 远程 存储 和 网 络 服务 等 。 通 常 地 ， 机 架 式 服务 器 应 用 较 多 的 是 大 型 
企业 ， 使 用 时 通过 柜 将 多 台 机 架 式 服务 器 放 在 一 起 ， 获 得 大 容量 存储 或 高 性 能 服务 。 

刀片 式 服务 器 是 指 在 标准 高 度 的 机 架 式 机 箱 内 可 插 装 多 个 卡 式 的 服务 器 单元 ”。 它 
是 一 种 高 可 用 高 密度 (High Availability High Density，HAHD) 的 低 成 本 服务 器 平台 ， 
刀片 式 服务 器 更 多 用 于 高 密度 堆 匡 ; 专 为 高 密度 计算 机 环境 和 一 些 特殊 应 用 场景 设计 的 。 
刀片 服务 器 的 主要 外 观 特 征 和 结构 特征 是 巨大 的 主体 机 箱 ， 在 其 机 箱 内 可 插 上 许多 “ 思 
片 ” 每 一 块 “ 刀 片 ” 实 际 上 就 是 一 台 服 务 器 系统 主板 ， 可 以 搭载 不 同 的 硬盘 ， 安 装 和 启 
动 自己 的 操作 系统 ， 构 成 独立 的 一 个 个 服务 器 ， 例 如 华为 的 E9000， 机 笼 高 度 120， 半 刀 
可 以 插入 16 块 ， 最 多 16X2=32 颗 处 理 器 。 一 方面 ， 每 一 块 刀 片 相 互 之 间 都 是 隔离 的 ， 
运行 自己 的 系统 ， 另 一 方面 ， 通 过 集群 系统 可 以 将 各 个 单独 的 “刀片 ”整合 成 一 个 服务 
器 集群 ， 提 高 服务 器 和 应 用 的 可 用 性 。 在 服务 器 集群 中 通过 插入 新 刀片 ， 可 以 提高 集群 
整体 性 能 。 刀 片 支持 热 插 拔 功能 ， 系 统 可 以 进行 轻松 的 升级 维护 操作 ， 并 将 维护 时 间 减 
少 到 最 小 。 刀 片 式 服务 器 通过 近 些 年 的 发 展 已 经 成 为 高 性 能 计算 集群 的 核心 设备 ， 并 成 
为 主要 架构 方式 。 一 般 应 用 于 大 型 的 数据 中 心 或 者 需要 大 规模 计算 的 领域 ， 如 银行 、 电 
信 、 人 金融 行业 以 及 互联 网 数据 中 心 等 。 但 是 ， 刀 片 服务 器 也 存在 一 些 问题 ， 比 如 散热 问 
题 ， 往 往 需 要 在 机 箱 内 装 上 强力 风扇 来 散热 。 


2.1.3 网络 资源 


如 图 2-4 所 示 , IT 系统 的 基础 设施 网 络 架构 可 以 划分 成 4 个 层次 , 从 下 到 上 依次 为 : 
存储 层 、 服 务 器 层 、 核 心 层 、 外 部 接 入 层 。 四 层 网 络 结构 实现 了 数据 快速 存储 和 交换 。 

存储 层 通过 TCP/IP 或 FC 网 络 连接 到 服务 器 层 ， 为 服务 器 提供 数据 存储 空间 资源 ， 服 
务 器 层 接 入 核心 层 ， 外 部 用 户 通过 接 入 层 也 连接 到 核心 层 ， 在 核心 层 实现 快速 数据 交换 。 
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外 部 接 入 层 
核心 层 Re s 
NS 
服务 器 层 


IPSAN FC SAN 磁带 库 
图 2-4 网络 架构 层次 


2.1.4 存储 资源 


存储 资源 根据 存储 的 位 置 可 分 为 内 部 存储 和 外 部 存储 。 后 续 章节 重点 介绍 外 部 存 
储 ， 如 第 7 章 和 第 9 章 分 别 介绍 SAN 存储 和 NAS 存储 。 这 里 介绍 一 些 常 见 的 存储 设备 ， 
如 图 2-5 所 示 。 _ 

光盘 是 以 光 信息 为 存储 的 载体 并 用 i 
来 存储 数据 的 一 种 物品 。 分 为 不 可 擦 写 
光盘 (如 CD-ROM、DVD-ROM 等 ) 和 可 擦 





光盘 硬盘 
写 光盘 (如 CD-RW、DVD-RAM 等 )。 光 盘 
存储 有 两 大 优点 : (1) 支持 数据 长 期 保 了 
存 ， 光 盘 数 据 可 以 保存 100 年 ; (2) 
硬盘 是 数据 存储 媒介 之 一 ， 传 统 硬 。 物理 带 库 性 盘 阵列 虚拟 磁带 库 
盘 由 一 个 或 者 多 个 铝 制 或 者 玻璃 制 的 碟 国 28 和 俐 人 全 


片 组 成 。 奉 片 外 歼 盖 有 铁 磁 性 材料 ， 容 量规 格 多 样 ， 有 5006B、1TB、2TB、4TB、6TB 等 。 
本 章 2. 4 小 节 有 详细 介绍 。 

磁带 是 载 有 厂 层 的 带 状 材料 ， 主 要 用 于 记录 声音 、 图 像 、 数 字 或 其 他 信和 号。 磁带 采 
用 专门 装置 和 软件 进行 读 取 ， 不 易 感 染病 毒 ， 并 且 支 持 离线 数据 存放 ， 因 此 银行 等 注重 
数据 安全 的 单位 常用 磁带 来 存储 重要 数据 。 磁 带 库 是 一 种 基于 磁带 的 备份 系统 ， 由 磁带 
权 位 、 机 械 手臂 (Robots) 和 驱动 器 (Drivers) 组 成 ， 数 据 的 读 写 由 驱动 器 完成 ， 磁 带 
的 拆卸 和 装填 由 机 械 手 臂 自动 实现 。 磁 带 库 能 够 提供 基本 自动 备份 和 数据 恢复 功能 ， 是 
集中 式 网 络 数据 备份 的 主要 设备 。 
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人 厂 盘 阵列 是 由 多 个 磁盘 组 合 而 成 的 一 个 大 容量 磁盘 组 ， 一 方面 ， 利 用 数据 条 带 化 方 
式 来 组 织 各 做 盘 上 数据 来 提升 整个 磁盘 系统 性 能 ， 男 一 方面 ， 利 用 郊 余 校 验 和 镜像 机 制 
来 提高 数据 安全 性 ， 在 磁盘 出 现 故 障 时 ， 仍 可 以 提供 数据 访问 ， 并 能 恢复 出 失效 数据 。 
本 书 第 4 章 对 磁盘 阵列 有 详细 介绍 。 


2.2 存储 系统 


2.2.1 存储 层次 结构 


存储 系统 是 指 计算 机 中 由 存放 程序 和 数据 的 各 种 存储 设备 、 控 制 部 件 及 管理 信息 调 
度 的 设备 (硬件) 和 算法 软件) 所 组 成 的 系统 。 计 算 机 的 主 存储 器 不 能 同时 满足 存 取 
速度 快 、 存 储 容量 大 和 成 本 低 的 要 求 ， 在 计算 机 中 必须 有 速度 由 慢 到 快 、 容 量 由 大 到 小 
的 多 级 层次 存储 器 ， 以 最 优 的 控制 调度 算法 和 合理 的 成 本 ， 构 成 具有 性 能 可 接受 的 存储 
系统 ， 如 图 2-6 所 示 ， 是 一 个 常见 的 存储 层次 结构 。 在 计算 机 系统 中 存储 层次 可 分 为 高 
速 缓冲 存储 器 、 主 存储 器 、 辅 助 存储 器 三 级 "”。 高 速 缓冲 存储 器 用 来 改善 主 存储 器 与 中 
央 处 理 器 的 速度 匹配 问题 : 辅助 存储 器 用 于 扩大 存储 空间 。 辅助 存储 器 也 称 为 外 部 存储 ， 
本 书 围绕 外 部 存储 系统 展开 介绍 。 
存储 层次 





速度 容量 价格 
nC 最 高 最 小 ”最 高 

ey 
” 最 低 最 大 最 低 


图 2-6 存储 层次 结构 
图 2-6 所 示 的 存储 物理 层次 。 事 实 上， 除了 存储 物理 层次 ， 也 存在 存储 逻辑 层次 ， 
如 图 2-7 所 示 ， 存 储 系统 可 以 分 为 应 用 层 (Application Layer)、 文 件 / 记 录 层 (File/ 
Record Layer) 和 块 接口 层 (Block Layer)， 这 是 存储 网 络 工业 协会 (SNIA) 提出 的 第 
一 版 存储 系统 届 辑 参考 模型 ””"。 对 存储 层 来 说 ， 上 一 存储 层 屏蔽 下 一 存储 层 的 信息 ， 逮 
辑 上 讲 ， 每 个 存储 层 都 是 一 个 逻辑 存储 设备 ， 具 有 独立 的 存储 空间 ， 该 存储 空间 既 可 以 
是 命名 空间 ， 也 可 以 是 线性 地 址 空间 。 多 个 相同 的 存储 层 可 以 通过 存储 空间 合并 的 方式 
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整合 在 一 起 , 构成 一 个 更 大 规模 的 存储 空间 ,这 也 是 存储 系统 扩展 的 一 般 化 方法 。 比 如 ， 
在 文件 层 , 可 以 将 多 个 物理 文件 系统 组 成 一 个 更 大 规模 的 分 布 式 文件 系统 ; 在 数据 块 层 ， 
可 以 将 多 个 物理 磁盘 组 成 一 个 更 大 的 “磁盘 ”， 如 磁盘 阵列 。 





图 2-7 存储 系统 的 多 辑 参 考 模型 (第 一 版 ) 


图 2-8 所 示 为 SNIA 提出 的 第 三 版 存储 系统 的 逻辑 参考 模型 。 在 这 个 版 本 中 ， 分 别 在 文 
件 层 和 数据 块 层 引入 了 文件 级 虚拟 化 模块 和 块 级 虚拟 化 模块 。 同 时 ， 通 过 SMI-S、SNMP 等 
管理 协议 对 整个 存储 系统 进行 统一 的 管理 ， 包 括 设备 发 现 、 监 控 、 审 计 、 元 余 、 备 份 等 。 
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图 2-8 存储 系统 的 逻辑 参考 模型 〈 第 二 版 ) 
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2.2.2 1/O 访问 路 径 


设计 和 部 署 存储 系统 需要 理解 [/0 访问 路 径 ，1/0 访问 路 径 是 指 指令 和 数据 在 存储 
系统 中 传递 的 通道 。 事 实 上 ，IV0 访问 路 径 包 括 物 理 过 程 和 逻辑 过 程 ， 前 者 是 数据 在 便 
件 部 件 上 实际 流动 的 过 程 ， 而 后 者 是 软件 对 数据 的 处 理 过 程 。 

图 2-9 所 示 为 一 个 主机 访问 远程 的 存储 设备 的 物理 1/0 路 径 。 文 件 请 求 通过 网 络 文 
件 协议 驱动 程序 发 给 网 络 接口 卡 ， 并 通过 网 络 连接 设备 〈 如 交换 机 ) 发 送 给 远程 存储 设 


备 〈 如 ，NAS )。 


网 络 文件 协议 
驱动 程序 


NIC 设 备 
驱动 程序 










存储 设备 


网 络 连接 设备 


图 2-9 网 络 数据 请 求 的 物理 1/0 路 径 


图 2-10 所 示 为 存储 系统 的 逻辑 1/0 路 径 。 逻 辑 1/0 路 径 包 括 系 统 调用 接口 、 文 件 
系统 、 设 备 驱动 程序 等 。 下 面 以 写 请 求 为 例 ， 分 别 介绍 本 地 写 和 远程 写 的 逻辑 1/0 路 径 。 
图 2-10 的 左 图 所 示 为 主机 内 部 的 存储 /0， 大 部 分 I/0 开始 于 要 访问 数据 的 应 用 ， 应 用 
通常 不 管 存 储 的 细节 ， 而 是 直接 调用 由 操作 系统 提供 的 系统 调用 接口 ， 然 后 由 文件 系统 
为 应 用 提供 数据 的 逻辑 地 址 和 在 磁盘 上 存储 的 物理 地 址 的 映射 ， 再 由 设备 驱动 层 通 过 
SCSI 协议 的 操作 ， 将 数据 存储 到 硬盘 上 。 图 2-10 的 右 图 所 示 为 主机 通过 网 络 的 存储 1/0， 
首先 1/0 由 上 层 应 用 发 起 ， 然 后 经 过 操作 系统 ， 由 文件 系统 提供 数据 的 届 辑 地 址 和 存储 
的 物理 地 址 的 对 应 关系 ， 经 由 设备 驱动 ， 到 达 FC HBA 卡 或 者 网 卡 ， 到 达 存 储 端的 FC 接 
口 或 者 网 络 接口 ， 将 数据 存储 到 存储 设备 上 。 

从 上 面 描述 可 知 , 主机 内 部 的 I/0 访问 需要 经 历 系统 调用 接口 、 文件 系统 访问 接口 、 
设备 驱动 层 、 驱 动 硬件 、 磁 盘 访 问 接口 等 环节 ， 这 些 环 节 对 数据 存储 的 可 靠 性 、 安 全 性 
和 性 能 都 会 产生 重要 影响 ， 从 独立 主机 的 角度 看 ， 主 机 内 部 1/0 流程 各 个 环节 共同 构成 
了 数据 存储 的 内 部 应 用 环境 。 
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系统 调用 接口 | 


图 2-10 数据 请 求 的 风 辑 I/0 路 径 


在 传统 存储 系统 中 ， 存 储 工作 通常 是 由 主机 内 置 的 硬盘 来 完成 ， 这 种 设计 方式 使 得 
硬盘 成 为 整个 系统 的 性 能 瓶颈 ; 此 外 ， 由 于 机 箱 空间 有 限 ,不仅 限制 了 硬盘 数量 的 扩展 ， 
而 且 影响 了 硬件 散热 和 供电 布线 。 内 置 存储 方式 也 不 利于 存储 空间 的 利用 和 共享 ， 因 为 
不 同 计算 机 使 用 各 自 内 置 的 硬盘 ， 导 致 存储 空间 利用 率 较 低 ， 并 且 分 散 保 存 的 数据 也 不 
利于 数据 的 共享 和 备份 。 传 统 的 C/S 架构 中 ， 无 论 使 用 的 是 何 种 协议 ， 存 储 设备 都 直接 
与 服务 器 相连 接 ， 在 这 种 结构 下 ， 存 储 设 备 上 的 任何 数据 读 写 操作 都 必须 经 由 服务 器 ， 
给 服务 器 造成 了 沉重 负担 。 外 部 存储 系统 的 出 现 ， 彻 底 将 服务 器 从 繁琐 的 1/0 操作 中 解 
放出 来 ， 使 服务 器 只 需要 承担 应 用 数据 的 操作 任务 ， 可 以 更 充分 地 释放 自身 潜能 。 


2.2.3 文件 系统 







在 计算 机 软件 系统 中 ， 文 件 系 统 (File System，FS) 是 操作 系统 用 于 存储 文件 的 
方法 和 数据 结构 ， 即 在 存储 设备 上 组 织 文件 的 方法 。 操 作 系统 中 负责 管理 和 存储 文件 信 
息 的 软件 称 为 文件 管理 系统 ， 简 称 文件 系统 。 文 件 系统 的 功能 包括 : 管理 和 调度 文件 的 
存储 空间 ， 提 供 文 件 的 逻辑 结构 、 物 理 结构 和 存储 方法 : 实现 文件 从 标识 到 实际 地 址 的 
映射 ( 即 按 名 存 取 )， 实 现 文 件 的 控制 操作 和 存 取 操 作 〈 包 括 文件 的 建立 、 撤 销 、 打 开 、 
关闭 ， 对 文件 的 读 、 写 、 修 改 、 复 制 、 迁 移 等 )， 实 现 文件 信息 的 共享 并 提供 可 靠 的 文件 
保密 和 保护 措施 。 | 

为 了 访问 硬盘 中 的 数据 ， 就 必需 在 扇 区 之 间 建 立 联系 ， 也 就 是 需要 一 种 逻辑 上 的 数 
据 存 储 结构 。 文 件 系 统 负责 建立 这 种 逻辑 结构 ， 在 硬盘 上 建立 文件 系统 的 过 程 通常 称 为 
“格式 化 ”。 如 图 2-11 所 示 ， 硬盘 数据 的 管理 通过 文件 分 区 表 ， 记 录 数 据 的 地 址 ,然后 通 
过 地 址 记录 实现 对 数据 的 读 取 。 

Windows、Linux、Macintosh 操作 系统 都 有 对 应 的 文件 系统 ， 比 如 ，Windows 的 FAT16、 
FAT32、NTFS 等 ， Linux 的 EXT2、EXT3、EXT4 等 ，Macintosh 的 HFS、HFS+ 等 。 上 面 这 些 
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都 是 主机 文件 系统 ， 主 机 文件 系统 也 称 为 本 地 文件 系统 。 此 外 ， 还 有 一 类 重要 的 文件 系 
统 是 分 布 式 文件 系统 。 分 布 式 文件 系统 均 为 客户 端 /服务 器 端 (Client/Server，C/S) 架 
构 ， 数 据 保 存在 服务 器 端 ， 而 客户 端的 应 用 程序 能 够 像 访问 本 地 文件 系统 一 样 访问 位 于 
远程 服务 器 上 的 文件 。 限 于 篇 幅 ， 下 面 简单 介绍 应 用 较 广 的 两 种 本 地 文件 系统 NTFS 和 
EXT3 和 两 种 分 布 式 文件 系统 Lustre 和 HDFS。 


最 新 用 户 名 {1234.doc | 
二 ee 
/ 
六 | 


文件 地 址 





图 2-11 文件 系统 


1. NTFS 

NTFS 文件 系统 是 一 个 面向 安全 性 的 文件 系统 ， 是 Windows NT 所 采用 的 独特 文件 系 
统 结 构 ， 它 是 建立 在 保护 文件 和 目录 数据 的 基础 上 ， 节 省 存储 资源 的 一 种 先进 的 文件 系 
统 ”。NTFS 的 特点 主要 体现 在 以 下 几 个 方面 。 

(1) NTFS 分 区 最 大 可 以 达到 2TB; 

(2) NTFS 是 一 个 可 恢复 的 文件 系统 。 当 发 生 系统 失败 事件 时 ，NTFS 通过 使 用 标准 
的 事务 处 理 日 志和 恢复 技术 来 保证 分 区 的 一 致 性 ; 

(3) NTFS 支持 对 分 区 、 文 件 夹 和 文件 的 压缩 。 任 何 Windows 应 用 程序 在 NTFS 分 区 
进行 数据 读 写 时 ， 文 件 系统 自动 压缩 和 解压 缩 。 对 文件 进行 读 取 和 写 入 时 ， 文 件 将 分 别 
进行 解压 缩 和 压缩 ; 

(4) NTFS 采用 了 更 小 的 数据 访问 单元 ， 可 以 有 效 地 管理 磁盘 空间 ， 避 免 磁盘 空间 的 


(5) 在 NTFS 分 区 上 ， 可 以 为 共享 资源 、 文 件 夹 以 及 文件 设置 访问 许可 权限 ; 
(6) NTFS 文件 系统 支持 磁盘 配额 管理 。 人 磁盘 配额 是 指 管理 员 可 以 为 用 户 所 能 使 用 的 
磁盘 空间 进行 配额 限制 ， 每 一 用 户 只 能 使 用 最 大 配额 范围 内 的 磁盘 空间 ; 
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(7) NTFS 使 用 “变更 ”日 志 来 跟踪 记录 文件 所 发 生 的 变更 。 

2,， BG 沁 

Ext 2/Ext 3/Ext 4 是 GNU/Linux 系统 中 标准 的 文件 系统 ， 其 具有 存 取 性 能 好 的 优 
点 ， 对 于 中 小 型 的 文件 访问 具有 优势 。Ext 文件 系统 中 ， 其 单一 文件 大 小 和 文件 系统 容 
量 上 限 都 与 文件 系统 访问 单元 ( 即 , 簇 ) 大 小 有 关 。 例如, 常见 X86 系统 的 簇 最 大 为 4KB， 
则 单一 文件 大 小 上 限 为 2048GB， 文 件 系统 的 容量 上 限 为 16384GB。 

Ext 3 文件 系统 是 对 Ext 2 系统 的 扩展 ， 是 一 种 日 志文 件 系 统 """"。 日 志 式 文件 系 
统 的 最 大 特色 是 ， 它 会 将 整个 磁盘 的 写 入 动作 完整 记录 在 磁盘 的 某 个 区 域 上 ， 以 便 有 需 
要 时 可 以 回溯 追踪 。 数 据 写 入 操作 涉及 许多 步 又， 包括 改变 文件 头 信息 、 搜 寻 磁 盘 可 写 
入 空间 、 一 个 个 写 入 磁盘 空间 等 ， 若 每 一 个 步骤 进行 到 一 半 被 中 断 ， 就 会 造成 文件 系统 
的 不 一 致 。 采 用 日 志 式 文件 系统 之 后 ， 由 于 详细 纪录 了 每 个 步骤 细节 ， 故 当 某 个 步骤 被 
中 断 时 ， 系 统 可 以 根据 这 些 记录 直接 回溯 并 重新 完成 被 中 断 的 部 分 ， 而 不 必 花 时 间 去 检 
查 其 他 的 部 分 ， 所 以 Ext3 文件 系统 具有 很 高 的 性 能 和 可 靠 性 。 

3 Lustre 

Lustre 文件 系统 于 1999 年 在 Carnegie Mellon University 启动 ， 现 在 已 经 发 展 成 
为 应 用 最 广泛 的 分 布 式 文件 系统 ""。Lustre 是 一 个 开源 项 目 ， 并 运行 在 知名 集群 存储 系 
统 中 ， 如 Blue Gene。 

Lustre 官方 手册 中 给 出 了 Lustre 文件 系统 的 架构 ， 如 图 2-12 所 示 。Lustre 文件 
系统 也 是 一 个 三 方 架构 , 包括 了 MDS (元 数据 服务 器 )、0SS (对 象 存储 服务 器 ) 和 Client 
(客户 端 ) 这 3 个 模块 。 文 件 的 打开 (open) 和 关闭 (close)、 元 数据 以 及 并 发 访问 控制 
都 在 Client 和 MDS 之 间 进 行 ; 文件 1/0 操作 以 及 文件 锁 在 0SS 和 Client 之 间 进 行 ， 文 
件 备 份 、 文 件 状 态 获取 以 及 文件 创建 等 在 MDS 和 0SS 之 间 进 行 。 目 前 Lustre 文件 系统 最 
多 可 以 支持 100000 个 Client，1000 个 0SS 和 2 个 MDS 节点 。 


目录 操作 ， 
文件 内 容 JO 
并 发 控制 





恢复 ， 文 件 状 
态 和 文件 创建 


图 2-12 Lustre 文件 系统 架构 
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4. HDFS 

HDFS 是 一 个 支持 数据 密集 型 分 布 式 应 用 的 分 布 式 文件 系统 。 它 能 够 保证 应 用 
可 以 在 上 千 个 低 成 本 商用 硬件 存储 节点 上 处 理 PB 级 的 数据 ， 和 Lustre 一 样 也 是 
开源 项 目 。HDFS 运行 在 商用 硬件 上 , 它 具 备 高 容错 性 , 可 运行 在 廉价 硬件 上 ; HDFS 
能 为 应 用 程序 提供 高 吞吐 率 的 数据 访问 ， 适 用 于 大 数据 集 的 应 用 ; HDFS 在 POSIX 
规范 进行 了 修改 ， 使 之 能 对 文件 系统 数据 进行 流 式 访问 ， 从 而 适用 于 批量 数据 的 
处 理 。 

如 图 2-13 所 示 ，HDFS 是 一 种 C/S 模式 的 系统 结构 。 主 服务 器 ， 即 图 中 的 命名 
节点 ， 它 管理 文件 系统 命名 空间 和 客户 端 访 问 ， 具 体 文件 系统 命名 空间 操作 包括 “打开 ?” 
“关闭 ”“ 重 命名 ”等 ， 并 负责 数据 块 到 数据 节点 之 间 的 映射 ， 数据 节点 除了 负责 管理 挂 
载 在 节点 上 的 存储 设备 ， 还 负责 响应 客户 端的 读 写 请 求 。HDFS 将 文件 系统 命名 空间 呈现 
给 客户 端 ， 并 运行 用 户 数据 存放 到 数据 节点 上 。 从 内 部 构造 看 ， 每 个 文件 被 分 成 一 个 或 
多 个 数据 块 ， 从 而 这 些 数据 块 被 存放 到 一 组 数据 节点 上 ; 数据 节点 会 根据 命名 节点 的 指 
示 执 行 数据 块 创建 、 删 除 和 复制 操作 。 为 了 保证 数据 不 丢失 ，HDFS 通过 在 三 个 数据 节点 
上 复制 数据 以 保证 可 靠 性 ， 即 ， 每 个 数据 块 存 放 三 份 副本 。 当 用 户 访问 文件 时 ，HDFS 把 
离 用 户 最 近 的 副本 数据 传递 给 用 户 使 用 。 


元 数据 名字， 副本 书 ，…) ， 
如 /home/foo/data，3，.…. 





图 2-13 文件 系统 的 整体 结构 
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基本 存储 设备 是 用 来 存放 数据 的 实际 物理 载体 ， 不 同 的 存储 设备 具有 不 同 的 物理 存 
储 机 理 ， 从 而 导致 存 取 过 程 的 差异 。 例 如 ， 机 械 硬 盘 和 固态 硬盘 都 按照 寻 址 访问 ， 机 械 
硬盘 采用 金属 盘 片 ， 内 嵌 机 械 装置 ， 抗 震 性 差 ， 固 态 人 硬盘 使 用 闪存 颗粒 ， 读 写 性 能 好 。 
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机 械 人 硬盘 和 固态 硬盘 是 目前 市 面 上 最 为 常见 的 两 种 基本 存储 设备 ， 下 面 分 别 介绍 两 种 全 
盘 的 实现 原理 和 工作 特性 。 
2.3.1 机 械 硬 盘 
.机 械 硬盘 结构 及 相关 参数 
os 如 图 2-14 所 示 ， 物 理 结 构 包含 机 械 装置 和 电子 装置 ， 


可 以 分 为 如 下 部 分 : 和 磁头 组 件 、 磁 头 驱 动机 构 、 盘 片 组 、 主 轴 驱 动 装置 、 控 制 电路 和 
接口 。 





图 2-14 机 械 硬盘 结构 


磁头 组 件 : 用 于 数据 的 读 取 和 写 入 。 便 盘 磁 头 是 硬盘 进行 读 写 的 “笔尖 ”， 是 硬 
盘 中 最 精密 的 部 位 之 一 ， 它 由 读 写 磁头 、 传 动手 臂 、 传 动 轴 三 部 份 组 成 。 pnd 
非 接 触 式 头 、 盘 结构 ， 加 电 后 在 高 速 旋转 的 磁盘 表面 移动 ， 与 盘 片 之 间 的 间 际 只 
0. 1hm 一 0. 3hum, 这 样 可 以 获得 很 高 的 数据 传输 率 。 现 在 转速 为 7200 转 的 硬盘 飞 高 ( 磁 
头 距离 盘面 高 度 ) 一 般 都 低 于 0. 3um， 以 利于 读 取 高 信 噪 比 信号 ， 提 高 数据 传输 的 可 
靠 性 。 

磁头 驱动 机 构 : 磁头 移动 需要 磁头 机 构 驱 动 才 能 实现 ， WaS 
到 指定 的 位 置 。 磁 头 驱 动机 构 由 电磁 线圈 电机 、 磁 头 驱动 小 车 、 防 震动 装置 构成 ， 高 精 
度 的 轻型 磁头 驱动 机 构 能 够 对 磁头 进行 正确 的 驱动 和 定位 ， 并 能 在 很 短 的 时 间 内 精确 定 
位 系统 指令 指定 的 磁道 。 

盘 片 组 : 数据 的 载体 。 现 在 硬盘 盘 片 大 多 采用 金属 薄膜 材料 ， 金 属 薄 腊 具 有 更 高 的 
存储 密度 、 高 剩 磁 及 高 矫 项 力 等 优点 。 除 了 金属 盘 片 ， 还 有 一 种 被 称 为 “玻璃 盘 片 ”的 
材料 作为 盘 片 基质 ， 玻 璃 盘 片 比 普通 盘 片 在 运行 时 具有 更 好 的 稳定 性 。 

主轴 驱动 装置 : 驱动 盘 片 维持 高 速 运转 的 装置 。 随 着 硬盘 容量 的 扩大 ， 主 轴 电 机 的 
速度 也 在 不 断 提 升 ， 开 始 采用 精密 机 械 工 业 的 液态 轴承 电机 技术 ， 这 样 有 利于 降低 硬盘 
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工作 噪音 。 

控制 电路 : 控制 磁头 感应 的 信和 号、 主轴 电 机 调 速 、 磁 头 驱 动 和 伺服 定位 等 ， 由 于 磁 
头 读 取 的 信号 微弱 ， 将 放大 电路 密封 在 腔 体内 ， 可 减少 外 来 信号 的 干扰 ， 提 高 操作 指令 
的 准确 性 。 

接口 : 用 于 硬盘 与 主板 连接 ， 常 见 的 接口 类 型 有 以 下 几 种 。 

ATA 全 称 是 Advanced Technology Attachment， 采 用 传统 40-Pin 并 口 数 据 线 连接 
主板 与 硬盘 ， 外 部 接口 速度 最 大 为 133Mbit/s， 由 于 并 口 数据 线 的 抗 干扰 能 力 差 ， 且 排 
线 占 空间 ， 不 利 计算 机 散热 ，ATA 逐渐 被 串口 ATA 所 取代 。 

SATA 全 称 是 Serial Advanced Technology Attachment， 也 就 是 使 用 串口 的 ATA 接 
口 , 因 抗 干扰 性 强 , 且 传输 线 比 ATA 的 细 得 多 , 支持 热 插 拔 等 功能 , 已 被 广 为 接 受 。 SATA-I 
的 外 部 接口 速度 已 达到 150MB/s, SATA-II 达到 300Mbit/s, SATA-III 将 达到 600Mbit/s。 

SCSI 全 称 为 Small Computer System Interface, 历 经 3 代 的 发 展 ,从 SCSI-1、SCSI-2 
到 SCSI-3( 参 看 本 书 6. 3 小 节 的 介绍 )。 工 作 站 级 个 人 计算 机 及 服务 器 通常 采用 SCSI 硬 
盘 ， 原 因 在 于 SCSI 硬盘 支持 高 转速 (如 ，15000RPM)， 且 数据 传输 时 占用 较 少 CPU 资源 。 
SCSI 硬盘 的 单价 比 ATA/SATA 硬盘 贵 。 

SAS 全 称 是 Serial Attached SCSI， 是 新 一 代 的 SCSI 技术 ， 它 使 用 串口 的 SCSI 接 
口 ， 其 传输 速度 ， 可 达到 12Gbit/s。 

硬盘 可 以 读 取 已 保存 的 数据 和 写 入 需要 保存 的 数据 ， 写 入 数据 实际 上 是 通过 磁头 对 
硬盘 表面 的 可 磁化 单元 进行 磁化 。 硬 盘 将 二 进 制 的 数字 信号 以 同心 圆 轨 迹 的 形式 一 圈 一 
圈 的 记录 在 涂 有 磁 介 质 的 高 速 旋转 的 盘面 上 。 读 取 数 据 时 ， 只 需 把 磁头 移动 到 相应 的 位 
置 读 取 此 处 的 磁化 编码 状态 即 可 。 人 磁盘 读 写 采用 随机 存 取 的 方式 ， 因 此 可 以 以 任意 顺序 
读 取 硬盘 中 的 数据 。 机 械 硬 盘 工 作 时 ， 电 动 马达 驱动 盘 片 高 速 旋转 ， 再 辅 以 磁头 的 操作 
来 存 取 数据 。 机 械 人 硬盘 的 磁头 ， 如 图 2-15 所 示 。 





电子 部 分 
电缆 线圈 
Se 被 磁化 的 粒子 
I oe- 
[| 
人 三 性 材料 
盘 片 





图 2-15 ”机械 硬盘 的 磁头 


机 械 部 分 遵循 着 以 下 4 个 原则 : (1) 系统 在 密封 机 构 里 ; (2〉 盘 片 固 定 并 由 主轴 驱 
动 进行 高 速 旋转 ; (3) 磁头 沿 盘 片 径 向 移动 ; (4) 磁头 在 盘 片 上 方 飞行 。 
电子 部 分 遵循 着 以 下 3 个 原则 : (1) 盘 片 上 溅 镀金 属性 粒子 ， 呈 不 规则 排列 ，(2) 通 
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过 控制 线圈 上 的 电流 ， 磁 头 形 成 磁场 ; (3) 对 盘面 上 的 金属 粒子 进行 磁化 。 
机 械 硬盘 盘 片 的 物理 构造 如 图 2-16 所 示 。 | 








ry 
5 





磁头 尼 磁头 在 不 同位 置 





图 2-16 硬盘 盘 片 的 启 停 区 和 数据 区 


硬盘 盘 片 可 分 为 4 部 分 ， 即 “局 停 区 ”“ 定 位 0 磁道”"”“ 固 件 区 ”“ 数 据 区 ”。 

(1) 启 停 区 : 盘 片 中 间 靠 近 主轴 电机 的 地 方 ， 硬 盘 不 加 电 时 磁头 停留 在 此 区 域 ， 因 
为 这 块 区 域 没 有 任何 数据 ， 适 合 磁头 的 起 落 。 

《2) 定位 0 磁道 : 是 硬盘 初始 化 时 磁头 用 来 定位 的 磁道 ， 它 是 磁头 寻 道 的 起 点 和 终 
点 ， 每 次 磁头 寻 道 都 从 定位 0 磁道 出 发 ， 寻 道 结束 后 回 到 定位 0 磁道 。 

(3) 固件 区 相当 于 硬盘 的 操作 系统 ， 位 于 盘 片 的 最 外 层 ， 也 叫 负 磁道 。 固 件 区 内 保 
存 着 硬盘 最 底层 的 基本 控制 程序 和 基本 参数 。 主 要 包括 缺陷 列表 、 检 验算 法 公式 和 内 部 
操作 指令 等 。 

(4) 数据 区 位 于 盘 片 的 正 磁道 内 ， 涂 抹 磁 介质 用 来 记录 数据 。 

硬盘 盘 片 在 逻辑 上 被 划分 为 磁道 、 柱 面 以 及 扇 区 ， 其 结构 关系 如 图 2-17 所 示 。 


0 号 磁头 “ 
0 号 磁道 
1 号 磁道 1 号 磁头 

2 号 磁头 
0 号 柱 面 

3 号 磁头 
1 号 柱 面 


4 号 磁头 


5 号 磁头 





图 2-17 盘 片 的 逻辑 结构 
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(1) 破 道 (Track ) 

磁盘 在 格式 化 时 被 划分 成 许多 同心 圆 ， 这 些 同心 圆 轨迹 叫做 磁道 (Track)。 人 磁道 由 
外 而 内 从 0 开始 顺序 编号 。 硬 盘 的 每 一 个 盘面 有 300 一 1024 个 磁道 ， 新 式 大 容量 硬盘 每 
面 的 磁道 数 更 多 。 这 些 同心 圆 不 是 连续 记录 数据 ， 而 是 被 划分 成 一 段 段 的 圆 弧 。 圆 弧 的 
角速度 一 样 ， 但 由 于 径 向 长 度 不 一 样 ， 所 以 线 速度 也 不 一 样 ， 外 圈 的 线 速 度 较 内 圈 的 线 
速度 大 ， 即 同样 的 转速 下 ， 外 图 在 同样 时 间 段 里 ， 滑 过 的 圆 弧 长 度 要 比 内 图 滑 过 的 圆 弧 
长 度 大 。 每 段 圆 弧 叫 做 一 个 扇 区 ， 扇 区 从 “1” 开 始 编号 ， 每 个 扇 区 中 的 数据 作为 一 个 单 
元 进行 读 出 或 写 入 。 一 个 标准 的 3. 5 英寸 磁盘 的 盘面 通常 有 几 百 到 几 千 条 磁道 。 人 磁道 是 
“看 ”不 见 的 ， 它 是 盘面 上 以 特殊 形式 磁化 了 的 磁化 区 ， 在 磁盘 格式 化 时 就 已 规划 完毕 。 

(2) 柱 面 (Cylinder) 

所 有 盘面 上 的 同一 磁道 构成 一 个 圆柱 ， 称 为 柱 面 Cylinder)， 每 个 圆柱 上 的 磁头 
由 上 而 下 从 “0” 开 始 编号 。 数 据 的 读 写 按 柱 面 进 行 ， 即 磁头 读 写 数 据 时 首先 在 同一 柱 面 
内 从 “0” 磁 头 开始 进行 操作 ， 依 次 向 下 在 同一 柱 面 的 不 同 盘 面 上 进行 操作 ， 当 同一 柱 面 
所 有 的 磁头 全 部 读 写 完毕 后 ， 磁 头 才 移 到 下 一 柱 面 ， 之 所 以 数据 的 读 写 按 柱 面 进行 ， 而 
不 按 盘面 进行 ， 是 因为 选取 磁头 只 需 通过 电子 切换 ， 而 选取 柱 面 则 必须 通过 机 械 切 换 。 
电子 切换 比 磁头 移动 快 得 多 。 也 就 是 说 ， 一 个 磁道 写 满 数据 后 ， 就 在 同一 柱 面 的 下 一 个 
盘面 来 号 ， 等 一 个 柱 面 写 满 后 ， 才 移 到 下 一 个 扇 区 开始 写 数据 。 读 数据 也 按照 这 种 方式 
进行 ， 这 样 就 提高 了 硬盘 的 读 写 效率 。 

一 块 硬 盘 驱 动 器 的 圆柱 数 〈 即 ， 每 个 盘面 的 磁道 数 ) 既 取 决 于 每 条 厂 道 的 宽 罕 ， 也 
取决 于 定位 机 构 所 决定 的 磁道 闻 步 距 的 大 小 。 

(3) 扇 区 〈S$ector) 

磁道 可 以 划分 成 若干 段 ， 每 段 称 为 一 个 硼 区 (Sector) ”…。 扇 区 是 硬盘 上 存储 的 物 
理 单 位 ， 包 括 512 个 字 节 的 数据 和 一 些 其 他 信息 。 即 使 计算 机 仅仅 需要 硬盘 中 的 某 个 字 
节 ， 也 必须 一 次 性 地 读 出 这 个 字 节 所 在 的 扇 区 中 的 全 部 512 个 字 节 ， 再 选择 所 需 的 那个 
字 节 。 扇 区 数据 主要 有 两 个 部 分 : 存储 数据 的 标识 符 和 存储 数据 的 数据 段 。 

标识 符 : 除了 包括 扇 区 地 址 : 肩 区 所 在 的 磁头 《或 盘面 )、 磁 道 〈 或 柱 面 号 ) 以 及 
房 区 在 磁道 上 位 置 ( 即 扇 区 编号 ),， 还 包括 一 个 标记 字段 , 标记 扇 区 是 否 可 以 存储 数据 或 
者 已 有 故障 不 宜 使 用 。 有 些 硬 得 控制 器 在 肩 区 标志 符 中 还 记录 提示 信息 ， 用 于 在 原 扇 区 
出 错时 指引 磁盘 转 到 对 应 蔡 换 扇 区 或 磁道 。 标 识 符 以 循环 见 余 校 验 (CRC) 值 作为 结束 ， 
供 控 制 器 检验 标识 符 是 否 有 误 。 

数据 段 : 分 为 数据 和 保护 数据 的 纠 错 码 (ECC)。 

每 条 磁道 中 ， 扇 区 号 是 按照 某 个 间隔 跳跃 着 编排 。 假 设 2 号 而 区 是 1 号 扇 区 后 的 按 
顺序 的 第 8 个 扇 区 ，3 号 扇 区 又 是 2 号 扇 区 后 的 按 顺 序 的 第 8 个 扇 区 ， 依 此 类 推 ， 这 个 
“8” 称 为 交叉 因子 。 如 图 2-18 所 示 ， 如 果 交 叉 因 子 是 “1”， 那 么 扇 区 就 按照 顺序 连续 编 
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写 。 一般 地 ， 数 据 读 取 经 常 需 要 按 顺 序 读 取 一 系列 相 邻 的 扇 区 (你 辑 数据 相 邻 ;。 如 对 磁 
道 扇 区 按 物理 顺序 进行 编号 ， 很 有 可 能 出 现 当 磁 头 读 取 完 第 一 个 扇 区 后 ， 由 于 盘 片 转速 
过 快 来 不 及 读 取 下 一 个 扇 区 ， 必 须 等 待 转 完 一 圈 ， 这 极 大 浪费 了 时 间 。 于 是 ， 工 程 师 提 
出 用 交叉 因子 来 解决 这 个 问题 。 一 个 硬盘 驱动 器 的 交叉 因子 取决 于 磁盘 控制 器 的 速度 、 
主板 的 时 钟 速度 、 与 控制 器 相连 的 输出 总 线 的 操作 速度 等 。 磁 盘 的 交叉 因子 值 太 高 或 太 
低 ， 数 据 在 磁盘 上 存 入 和 读 出 的 等 待 时 间 都 会 增加 。 


情况 B: 交叉 因子 2:1 


情况 C: 交叉 因子 3:1 





情况 A: 交叉 因子 1:1 
(顺序 连续 编号 ) 





图 2-18 不 同 交叉 因子 的 效果 示例 


前 面 已 经 提 及 ， 在 磁盘 上 写 入 或 读 取 数 据 时 ， 写 满 一 磁道 后 转向 同一 柱 面 的 下 一 个 
磁头 ， 当 柱 面 写 满 时 ， 再 转 癌 下 一 柱 面 。 这 些 转换 都 需要 时 间 ， 而 在 此 期 间 磁 盘 始 终 保 
持 高 速 旋转 , 这 就 会 带 来 一 个 问题 。 假定 系统 刚刚 结束 对 一 个 磁道 最 后 一 个 局 区 的 写 入 ， 
并 且 已 经 设置 了 最 佳 交 又 因子 值 ， 现 在 准备 在 下 一 人 磁道 的 第 一 个 记 区 写 入 ， 这 时 就 要 等 
到 磁头 部 件 重新 定位 并 按 径 向 方 同 到 达 下 一 磁道 ,如 果 这 个 操作 占用 时 间 超 过 了 一 点 点 ， 
尽管 有 交叉 存 取 ， 磁 头 仍 会 延迟 到 达 。 解 决 的 办 法 是 以 原先 磁道 所 在 位 置 为 基准 ， 把 新 
磁道 〈 下 一 磁道 ) 上 全 部 扇 区 号 移动 约 一 个 或 几 个 书 区 位 置 ， 这 就 是 磁头 扭 斜 。 磁 头 捍 
斜 可 以 理解 为 柱 面 与 柱 面 之 间 的 交叉 因子 , 便 盘 出 厂 便 设置 好 , 用 户 一 般 不 用 去 改变 它 。 
人 磁头 扭 斜 只 在 文件 较 长 超过 磁道 结尾 进行 读 出 和 写 入 时 才 发 挥 作用 。 所 以 ， 扭 斜 设置 不 
正确 所 带 来 的 时 间 损 失 比 交叉 因子 小 得 多 。 

(4) 入 (Cluster) 

人 厂 盘 中 ， 局 区 是 实际 物理 单位 ， 秘 就 是 硬盘 上 存储 文件 的 一 个 逻辑 单位 。 物 理 相 邻 
的 若干 个 扇 区 组 成 一 个 艇 〈Cluster)。 操 作 系统 读 写 磁盘 的 基本 单位 是 扇 区 ， 而 文件 系 
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统 的 基本 单位 是 艇 。 

在 Windows 系统 中 ， 任 意 找 一 个 儿 十 字 节 的 文件 ， 右 键 属性 ， 查 看 实际 大 小 与 占用 
空间 两 项 内 容 ， 如 大 小 : 15 字 节 ， 占 用 空间 : 8. 00KB (8 192 字 节 )。 这 里 的 占用 空间 就 
是 机 器 分 区 的 簇 大 小 ， 因 为 再 小 的 文件 都 会 占用 空间 (人 逻辑 基本 单位 是 8KB， 所 以 都 会 
占用 8KB)。 簇 一 般 有 这 几 类 大 小 : 4KB、8KB、16KB、32KB、64KB 等 。 簇 越 大 存储 性 能 
好 ， 但 空间 浪费 严重 。 簇 越 小 性 能 相对 越 低 ， 但 空间 利用 率 高 。 

(5) 磁头 数 (Head Number) 

磁盘 上 每 个 盘面 都 有 对 应 的 读 写 磁头 ;磁头 数 与 盘面 数 相等 。 

硬盘 的 各 项 基本 参数 影响 着 这 个 硬盘 的 性 能 表现 ， 从 而 与 整个 系统 的 性 能 有 着 密切 
的 关系 。 硬 盘 的 各 项 基本 参数 如 图 2-19 所 示 。 





图 2-19 硬盘 主要 参数 


(1)》 容量 

磁盘 作为 数据 存储 设备 ， 容 量 是 硬盘 最 主要 的 参数 。 硬 盘 的 容量 以 兆 字 节 (MB) 或 
千 兆 字 节 (GB) 为 单位 (1GB=1024MB)。 不 过 硬盘 厂商 在 标 称 硬盘 容量 时 通常 取 16B= 
1000MB， 因 此 人 们 在 系统 中 看 到 的 容量 往往 会 比 标 称 值 要 小 一 些 。 人 硬盘 的 容量 参数 还 包 
括 硬盘 的 单 碟 容 量 和 碟 片 数量 。 所 谓 的 单 碟 容 量 是 指 硬 盘 单 个 盘 片 的 容量 ， 单 碟 容 量 越 
大 ， 单 位 成 本 越 低 ， 平 均 访问 时 间 也 越 短 。 

(2) 转速 

转速 是 硬盘 内 电机 主轴 的 旋转 速度 ， 也 是 硬盘 枚 片 在 一 分 钟 内 所 能 完成 的 最 大 转 
数 。 转 速 是 表示 硬盘 档次 的 重要 参数 之 一 ， 也 是 决定 硬盘 内 部 传输 率 的 关键 因素 之 一 ， 
在 很 大 程度 上 直接 影响 到 硬盘 的 传输 速度 ,硬盘 转速 以 每 分 钟 多 少 转 来 表示 , 单位 为 RPM 
(Revolutions Per Minute)。RPM 值 越 大 ， 内 部 传输 率 就 越 高 ， 访 问 时 间 就 越 短 ， 硬 盘 
整体 性 能 也 越 好 。 目 前 主流 SATA 硬盘 的 转速 一 般 为 5400RPM 和 7200RPM，SAS 便 盘 转速 
- 般 为 7200RPM、10000RPM 和 15000RPM。 

(3) 平均 访问 时 间 

平均 访 逆 时 间 主 要 由 以 下 三 项 构成 : 平均 寻 道 时 间 、 平 均等 待 时 间 和 数据 传输 时 间 ， 
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其 中 ， 数 据 传输 时 间 非 常 小 ， 可 以 忽略 不 计 。 

平均 寻 道 时 间 (Average Seek Time) 是 指 磁 头 移动 到 指定 磁道 所 需 的 时 间 ， 单 位 
为 ms。 它 由 转速 、 单 碟 容 量 等 多 个 因素 综合 决定 的 。 一 般 来 说 ， 硬 盘 的 转速 越 高 ， 其 平 
均 寻 道 时 间 就 越 低 : 单 碟 容 量 越 大 ， 其 平均 寻 道 时 间 就 越 低 。 目 前 主流 机 械 硬 盘 的 平均 
寻 道 时 间 通 常 在 6ms 到 12ms 之 间 。 

平均 等 待 时 间 (Average Latency Time) 是 指 磁头 已 处 于 指定 的 磁道 ， 等 待 所 要 访 
问 的 扇 区 旋转 至 磁头 下 方 的 时 间 。 平 均等 待 时 间 通 常 为 盘 片 旋转 半 周 所 需 时 间 《〈 平 均 情 
况 下 ， 需 要 旋转 半 圈 )， 因 此 硬盘 转速 越 快 ， 等待 时 间 就 越 短 ， 一 般 应 在 4ms 以 下 。 以 一 
个 7200PRM 的 硬盘 为 例 ， 每 旋转 一 周 所 需 时 间 为 60X1000 二 7200=8. 33ms， 则 平均 等 待 
时 间 为 8. 33 二 2=4. 17ms。 

(4) 传输 速率 

传输 速率 (Data Transfer Rate) 是 指 硬盘 读 写 数 据 的 速度 ， 单 位 为 MB/s。 硬 盘 数 
据 传输 率 包 括 内 部 数据 传输 率 和 外 部 数据 传输 率 。 

内 部 传输 率 (Internal Transfer Rate) 也 称 为 持续 传输 率 (Sustained Transfer 
Rate)， 它 反映 了 硬盘 缓冲 区 未 用 时 的 性 能 。 内 部 传输 率 主要 依赖 于 硬盘 的 旋转 速度 ， 它 
可 以 明确 表现 出 硬盘 的 读 写 速度 ， 它 的 高 低 是 评价 一 个 硬盘 整体 性 能 的 决定 性 因素 。 

外 部 传输 率 (External Transfer Rate) 也 称 为 突 发 数据 传输 率 (Burst Data 
Transfer Rate) 或 接口 传输 率 ， 它 标 称 的 是 系统 总 线 与 硬盘 缓冲 区 之 间 的 数据 传输 率 ， 
外 部 数据 传输 率 主 要 跟 硬 盘 接 口 类 型 和 硬盘 缓存 的 大 小 有 关 。 

(5) 缓存 大 小 

缓存 (Cache memory) 是 硬盘 控制 器 上 的 一 块 内 存 芯 片 ， 具 有 极 快 的 存 取 速 度 。 由 
于 硬盘 的 内 部 数据 传输 速度 和 外 界 接 口传 输 速度 不 同 ， 组 存在 其 中 起 到 一 个 缓冲 的 作用 ， 
因此 ， 它 是 硬盘 内 部 存储 和 外 界 接口 之 间 的 缓冲 器 。 

缓存 有 助 于 大 幅度 提高 硬盘 整体 性 能 ， 缓 存 的 大 小 是 直接 关系 到 硬盘 传输 速度 的 重 
要 因素 。 当 硬盘 存 取 零 散 数据 时 需要 不 断 地 在 硬盘 与 内 存 之 间 交 换 数 据 ， 如 果 有 缓存 ， 
则 可 以 将 那些 零散 数据 暂 存 在 缓存 中 ， 不 仅 减 小 盘 外 系统 的 负荷 ， 也 提高 了 数据 的 传输 
速度 ， 从 而 提高 硬盘 的 整体 传输 性 能 。 

2. 硬盘 IOPS 计算 

I/0 指 的 是 输入 /输出 ， 衡 量 1/0 速度 通常 采用 IOPS (Input/0utput Per Second)。 
硬盘 IOPS 代表 的 是 每 秒 的 输入 输出 量 或 读 写 次 数 )， 它 是 衡量 磁盘 性 能 的 一 个 主要 
指标 。 机 械 硬 盘 的 连续 读 写 性 很 好 ,但 随机 读 写 性 能 很 差 。 图 2-20 所 示 为 顺序 访问 和 
随机 访问 的 示意 。 读 写 数据 时 ， 需 要 将 磁头 移 至 指定 的 磁道 上 ， 即 ， 寻 道 。 随 机 读 写 
将 引起 磁头 不 停 地 在 不 同 磁道 上 移动 ， 而 寻 道 操作 需要 一 定时 间 ， 从 而 限制 了 随机 读 
写 性 能 。 
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顺序 访问 

1 2 3 +4 5 6 7 8 
随机 访问 

1 3 7 2 8 6 4 


图 2-20 ”顺序 读 写 和 随机 读 写 


吞吐 量 〈Throughput ) 指 单位 时 间 内 成 功 传输 的 数据 量 。 相 比 IOPS 指标 ， 顺 序 大 
文件 读 写 的 应 用 (如 视频 编辑 、 视 频 点 播 ) 更 加 关注 吞吐 量 指标 。 例 如 ， 读 取 10000 个 
1KB 文件 ， 用 时 10s， 则 Throughput=1Mbit/s，IOPS=1000; 读 取 1 个 10MB 文件 ， 用 时 
0.2s， 则 Throughput=50Mbit/s，IOPS=5。 可 以 看 出 ， 小 文件 读 写 应 用 重视 IOPS， 而 大 
文件 读 写 应 用 追求 吞吐 量 。 

见 磁盘 的 平均 物理 寻 道 时 间 为 : 

7200RPM 的 SATA 硬盘 平均 物理 寻 道 时 间 大 约 为 9ms; 

10000RPM 的 SAS 硬盘 平均 物理 寻 道 时 间 大 约 为 6ms; 

15000RPM 的 SAS 硬盘 平均 物理 寻 道 时 间 大 约 为 4ms。 

见 硬 盘 的 旋转 延迟 〈 即 ， 平 均等 待 时 间 ) 为: 

7200RPM 的 磁盘 平均 旋转 延迟 大 约 为 60 X1000/7200/2=4. 17ms; 

10000RPM 的 磁盘 平均 旋转 延迟 大 约 为 60 X1000/10000/2=3ms; 

15000RPM 的 磁盘 平均 旋转 延迟 大 约 为 60 X1000/15000/2=2ms。 

最 大 IOPS 的 理论 计算 方法 : 

IOPS=1000ms/( 寻 道 时 间 + 旋 转 延 迟 ) 

7200RPM 的 磁盘 IOPS=1000/ (9+4. 17) =76; 

10000RPM 的 磁盘 IOPS=1000/ (6+3) =111; 

15000RPM 的 磁盘 IOPS=1000/ (4+2) =166。 

表 2-1 所 列 是 一 些 常 见 硬盘 IOPS 的 参考 值 (数据 仅 供 参 考 )。 

表 2-1 硬盘 IOPS 
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2.3.2 固态 硬盘 








固态 硬盘 〈Solid State Disk，SSD) 是 一 种 以 固态 电子 存储 忆 片 作为 永久 性 存储 
器 的 存储 设备 ”。 虽 然 固态 硬盘 不 是 使 用 “ 碟 盘 ”来 记 存 数据 ， 也 没有 用 于 “驱动 ”的 
马达 ， 但 是 人 们 依照 命名 习惯 ， 仍 然 称 为 固态 硬盘 或 固态 驱动 器 。 固 态 硬盘 分 为 易 失 性 
与 非 易 失 性 两 种 ， 这 里 着 重 介绍 更 适合 作为 传统 硬盘 替代 品 的 非 易 失 性 固态 硬盘 。 

固态 盘 的 存储 介质 是 闪存 颗粒 ， 闪 存 (Flash) 是 一 种 电压 控制 型 器 件 ”。 非 易 失 
性 固态 硬盘 采用 的 是 NAND 型 闪存 。NAND 型 闪存 分 为 单 层 单元 内 存 (Single-Level Cell， 
SLC) 和 多 层 单元 闪存 (Multi-Level Cell，MLC) 两 种 ， 两 者 主要 区 别 是 SLC 每 一 个 单 
元 储存 一 位 数据 (1bit)， 而 MLC 每 一 个 单元 储存 两 位 数据 (2bit)， 因 此 MCL 的 数据 密 
度 要 比 SLC 大 一 倍 ， 并 且 从 成 本 角度 看 ，MLC 也 具有 很 大 的 优势 。SLC 的 特点 是 成 本 高 、 
容量 小 、 速 度 快 ， 而 MLC 的 特点 是 容量 大 、 成 本 低 ， 但 是 速度 慢 。 另 外 ，SLC 在 寿命 、 
可 靠 性 和 能 耗 三 方面 都 优 于 MLC。 

固态 硬盘 结构 原理 如 图 2-21 所 示 。 


SSD 使 件 结构 原理 












SSD 架 构 框图 


图 2-21 固态 硬盘 结构 原理 


非 易 失 性 固态 硬盘 中 数据 的 存 取 主 要 由 NAND Flash 及 其 主 控 芯 片 来 实现 ， 整 体 结 
构 为 纯 电 路 芯片 结构 ”。 相 对 于 机 械 硬盘 ， 固 态 硬盘 有 以 下 优点 : 无 高 速 旋转 部 件 ， 性 
能 高 、 功 耗 低 ; 多 通道 并 发 ， 通 道内 Flash 颗粒 复 用 时 序 ; 支持 TCQ/NCQ， 一 次 响应 多 
个 I/0 请 求 ， 典型 响应 时 间 低 于 0. lms。 


= 和 一 
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NCQ (Native Command Queuing) 与 TCQ (Tagged Command Queuing) 是 优化 硬盘 性 
能 的 指令 排序 技术 ， 通 过 把 计算 机 发 向 硬盘 的 指令 进行 重新 排序 ， 使 得 硬盘 在 相同 时 间 
间隔 能 完成 更 多 的 1/0 请 求 , 从 而 提高 硬盘 的 总 体 效率 。NCQ 技术 在 300Mbit/s 的 Serial 
ATA II 规格 中 引入 ， 针 对 的 是 主流 的 硬盘 产品 ， 而 TCQ 技术 是 在 SCSI-2 规格 中 引入 ， 
针对 的 是 服务 器 以 及 企业 级 硬盘 产品 。 要 使 用 NCQ 和 TCQ 功能 ， 前 提 是 芯片 组 硬盘 接口 
和 硬盘 产品 二 者 都 支持 NCQ 和 TCQ。 

相 比 机 械 硬盘 ， 固 态 硬 盘 在 性 能 、 能 耗 和 环境 适应 性 方面 存在 优势 。 

(1) 性 能 优势 

硬盘 性 能 主要 体现 在 响应 时 间 和 读 写 效率 上 ， 一 方面 ， 固 态 人 硬盘 的 响应 时 间 短 。 传 
统 人 硬盘 的 机 械 特性 导致 大 部 分 访问 时 间 浪 费 在 寻 道 和 机 械 延 迟 上 ， 数 据 传输 效率 受到 严 
重 制 约 ， 而 固态 人 硬盘 内 部 没有 机 械 运动 部 件 ， 省 去 了 寻 道 时 间 和 机 械 延 迟 ， 可 以 更 快捷 
地 响应 读 写 请 求 。 

另 一 方面 ， 固 态 硬 盘 的 读 写 效率 高 。 机 械 硬 盘 在 进行 随机 读 写 操作 时 ， 磁 头 不 停 地 
移动 ， 导 致 读 写 效率 低下 ; 而 固态 硬盘 通过 内 部 控制 器 计算 出 数据 的 存放 位 置 ， 并 进行 
读 写 操作 ， 省 去 了 机 械 操作 时 间 ， 大 大 提高 了 读 写 效率 。 例如， 在 4KB 随机 读 写 情况 下 : 
FC 硬盘 的 性 能 为 400/400 IOPS， 固 态 便 盘 的 性 能 为 26000/5600 IOPS。 

(2) 能 耗 优势 

无 论 是 机 械 硬盘 还 是 固态 硬盘 ， 它 们 都 需要 通电 来 进行 工作 。 除 了 上 述 性 能 优势 ， 固 
态 硬盘 在 能 耗 方面 的 表现 也 优 于 机 械 硬 盘 。 固 态 硬盘 和 机 械 硬 盘 功 耗 对 比如 图 2-22 所 示 。 





热 图 对 比 100K 读 IOPS 功 耗 对 比 
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图 2-22 固态 硬盘 和 机 械 硬盘 功 耗 对 比 





由 于 机 械 硬 盘 采 用 机 械 方式 工作 ， 其 功 耗 主要 用 于 马达 驱动 和 磁头 读 写 ， 因 此 硬盘 
功 耗 和 盘 片 大 小 与 转速 密切 相关 ， 比 如 ，3.5 英寸 机 械 硬盘 运行 功 耗 约 为 2.5 英寸 机 械 
硬盘 的 2 倍 。 
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固态 硬盘 的 工作 功 耗 主要 用 于 主 控 的 运算 和 闪存 世 片 擦 写 ， 相 比 于 机 械 人 硬盘 ， 固 态 硬盘 
功 耗 小 一 些 。 还 需要 指出 的 一 点 是 ， 固 态 硬盘 在 计算 机 待机 状态 下 可 以 几乎 完全 断 电 ， 而 机 
械 硬 盘 为 了 保证 唤醒 速度 很 难 做 到 完全 断 电 ， 因 此 在 待机 能 耗 这 一 点 上 固态 硬盘 也 是 占 优 的 。 

(3) 环境 适应 性 优势 

相 比 机 械 硬 盘 ， 固 态 硬 盘 具 有 很 强 的 环境 适应 性 ， 其 原因 在 于 固态 便 盘 不 含 高 速 旋转 
的 机 械 结构 部 件 。 固态 硬盘 可 承受 振动 加 速度 16. 46， 机 械 硬 盘 一 般 为 0. 56 以 下 ; 固态 硬 
盘 抗 冲击 15006， 机 械 硬 盘 一 般 为 706 左右 ; 另外， 使 用 专用 设备 进行 静 压 试验 、 跌 落 试 
验 、 随 机 振动 试验 、 剖 击 试验 、 碰 撞 试 验 等 可 靠 性 检测 ， 固 态 硬盘 也 有 更 优 的 表现 。 

固态 硬盘 通常 能 满足 工业 级 应 用 要 求 ， 如 -20C 到 70C、-40C 到 85C 的 宽 温 要 求 。 简 
言 之 ， 固 态 硬盘 可 用 在 一 些 环境 较 恶 劣 的 场合 ， 如 高 温 、 高 混 、 强 震 等 恶劣 环境 下 使 用 。 
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2.4.1 存储 虚拟 化 概述 


一 个 大 型 公司 的 关键 数据 往往 分 布 在 几 十 甚至 上 百 个 站 点 上 ， 一 个 SAN 系统 往往 有 
许多 异 构 的 服务 器 和 存储 设备 ， 因 此 业务 数据 的 高 效 、 安 全 管理 成 为 存储 系统 的 一 大 挑 
战 。 同 时 ， 随 着 存储 系统 规模 的 增 大 ， 存 储 管理 开 文 的 增长 速度 远 高 于 硬件 投资 的 增长 
速度 。 针 对 存储 管理 这 一 挑战 ， 存 储 系统 设计 者 提出 了 存储 虚拟 化 技术 。 存 储 虚 拟 化 在 
存储 设备 上 加 入 一 个 逻辑 层 ， 通 过 逻辑 层 访问 存储 资源 ， 对 管理 员 来 说 ， 可 以 很 方便 的 
调整 存储 资源 ， 提 高 存储 利用 率 。 由 于 存储 虚拟 化 屏 培 了 具体 的 存储 资源 的 物理 细节 ， 
并 给 统一 访问 接口 ， 用 户 不 必 关 心 存储 设备 的 配置 、 物 理 位 置 、 物 理 参 数 甚至 容量 限制 
等 ， 从 而 给 用 户 提 供 了 更 好 的 性 能 和 易 用 性 。 有 报告 指出 ， 存 储 虚拟 化 能 够 每 年 为 客户 
节约 24% 硬件 成 本 、16% 软件 成 本 和 19% 存储 管理 成 本 。 

SNIA 对 存储 虚拟 化 (Storage Virtualization ) 的 定义 如 下 : “The act of 
abstracting, hiding, or isolating the internal function of a storage (sub) System 
or service from applications, compute servers or general network resources for 
the purpose of enabling application and network independent management of storage 
or data. ”其 含义 是 ， 通 过 对 存储 〈 子 ) 系统 或 存储 服务 的 内 部 功能 进行 抽象 、 隐 藏 或 
隅 离 ， 使 存储 或 数据 的 管理 与 应 用 、 服 务 器 、 网 络 资源 的 管理 分 离 ， 从 而 实现 应 用 和 网 
络 的 独立 管理 。 

对 存储 服务 和 设备 进行 虚拟 化 ， 能 够 在 对 下 一 层 存储 资源 进行 扩展 时 进行 资源 合 
并 ， 降 低 实 现 的 复杂 度 。 如 图 2-23 所 示 ， 根 据 实 现 位 置 ， 存 储 虚 拟 化 包括 基于 主机 的 存 
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储 虚拟 化 、 基 于 网 络 的 存储 虚拟 化 和 基于 存储 设备 /存储 子 系统 的 存储 虚拟 化 ; 根据 实现 
方式 ， 可 以 分 为 带 内 虚拟 化 和 带 外 虚拟 化 ， 带 内 传输 模式 是 指数 据 流 和 控制 流 采 用 同一 
通道 ， 而 带 外 传输 模式 指数 据 流 和 控制 流 经 过 不 同 通道 。 


存 铺 诬 执 做。 上 二 三 = 一 == 一 = 一 = 一 一 一 = 一 = = 







[实现 结果 
| | 
| | 
| 块 磁盘 磁带 、 磁 带 驱 动 文件 系统 | 
| “| -虚拟 化 虚拟 化 器 、 磁 带 库 虚 拟 化 虚拟 化 
三 Fe 
实现 位 置 





图 2-23 存储 虚拟 化 的 实现 


另外 ， 存 储 虚 拟 化 可 以 在 系统 的 多 个 层面 实现 ， 如 人 磁盘 虚拟 化 、 磁 带 虚 拟 化 、 磁 带 
库 虚 拟 化 、 文 件 系统 虚拟 化 等 。 从 SNIA 发 布 的 存储 系统 的 逻辑 参考 模型 第 二 版 ， 如 图 2-8 
所 示 ， 可 以 看 出 ， 存 储 虚 拟 化 主要 可 以 归 为 两 类 : 数据 块 级 虚拟 化 和 文件 级 虚拟 化 。 


2.4.2 数据 块 级 虚拟 化 


数据 块 级 虚拟 化 的 两 个 典型 案例 是 RAID 和 SAN™。 

伐 盘 阵列 CRAID) 的 虚拟 化 是 由 RAID 控制 器 实现 的 ， 它 提供 硬 RAID 或 软 RAID 技 
术 ， 将 多 个 物理 磁盘 按 不 同 的 分 块 级 别 组 织 在 一 起 ， 通 过 主板 上 CPU 及 阵列 管理 固件 来 
控制 及 管理 硬盘 ， 解 释 用 户 的 1/0 指令 并 将 它们 发 给 物理 磁盘 执行 ， 从 而 屏蔽 了 具体 的 
物理 磁盘 , 为 用 户 提供 了 一 个 统一 的 具有 容错 能 力 的 逻辑 虚拟 磁盘 , 用 户 对 RAID 的 存储 
操作 就 像 对 普通 磁盘 一 样 。 由 于 IDE 通道 的 数量 和 速度 的 限制 ，RAID 的 传统 接口 一 直 使 
用 的 是 SCSI。 随 着 存储 技术 的 飞速 发 展 ， 许 多 新 的 RAID 技术 也 不 断 开发 出 来 ， 许 多 厂 
商 的 存储 设备 的 磁盘 阵列 开始 提供 2GB 的 高 速 接口 。 文 献 [26] 介 绍 了 近来 康 柏 的 
Virtualized Array《〈 虚 拟 阵列 ) 可 以 说 是 RAID 的 发 展 ， 它 将 系统 内 的 所 有 硬盘 当 作 一 
个 统一 的 存储 空间 来 管理 ， 所 有 的 子 阵列 ， 都 平均 分 摊 到 每 一 个 系统 内 的 物理 硬盘 上 。 
整个 系统 中 的 硬盘 数量 可 以 任意 进行 改变 ， 数 据 的 存放 可 以 随 着 组 的 调整 而 动态 调整 。 
与 传统 RAID 相 比 , 它 使 用 了 全 光纤 通道 体系 结构 , 能 够 满足 对 数据 输入 输出 性 能 和 可 扩 
展 性 有 较 高 要 求 的 用 户 ， 具 有 更 大 的 优势 ， 更 适合 高 端 开放 系统 的 用 户 。 

SAN 存储 设备 用 专用 网 络 ( 如 ，FC) 相连 的 ，SAN 可 以 提供 灵活 的 存储 模型 ， 服 务 
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器 和 设备 可 以 在 其 中 任意 互联 ， 传 送 比 SCSI 更 远 的 距离 ， 由 于 SAN 的 这 些 优异 的 性 能 ， 
使 其 成 为 企业 存储 的 重要 技术 。 然 而 ，SAN 技术 存在 如 下 问题 : (1) 不 同 厂家 的 软 硬 件 
产品 、 不 同 的 操作 系统 以 及 不 同 的 数据 格式 造成 在 SAN 中 的 互联 困难 重重 。 各 厂家 单独 
组 网 工作 得 很 好 ， 一 旦 其 中 有 别 的 厂家 的 设备 ， 要 么 连 不 上 ， 要 么 出 错 ; (2) 虽然 各 厂 
家 的 设备 都 遵循 光纤 通道 标准 ， 但 具体 的 实现 又 有 很 大 差别 。 即 使 各 厂家 都 愿意 将 技术 
改变 以 适应 互联 ， 其 工作 量 也 是 令 人 难以 接受 的 ; (3) 由 于 SAN 本 身 的 专 有 性 ， 使 得 公 
司 内 部 容易 形成 许多 规模 不 同 的 SAN 存储 孤岛 ， 存 储 孤 岛 的 存在 容易 造成 数据 的 安全 隐 
患 ， 数 量 庞大 的 业务 数据 不 能 共享 ， 对 公司 数据 的 正常 管理 和 运行 会 构成 威胁 。 针 对 上 
述 问题 ， 需 要 采取 SAN 虚拟 化 技术 。 

实现 SAN 虚拟 化 时 ， 需 要 在 原 有 体系 结构 中 加 入 一 个 新 的 虚拟 化 层 架 构 。 通 过 这 个 
虚拟 化 层 ， 可 以 将 多 种 设备 上 比较 小 的 存储 容量 集合 起 来 ， 虚 拟 成 一 个 大 的 磁盘 ， 提 高 
存储 容量 的 使 用 率 ， 为 应 用 程序 和 用 户 提供 SAN 的 全 局 逻辑 虚拟 化 视图 。 服 务 器 不 必 关 
心 后 端的 物理 设备 的 物理 特性 ， 也 不 会 因为 物理 设备 发 生 任何 变化 而 受 影响 ， 从 用 户 和 
应 用 程序 看 来 ， 原 来 复杂 结构 的 SAN 就 是 一 个 结构 相对 简单 的 、 有 具有 统一 界面 的 虚拟 存 
储 池 ， 它 对 用 户 和 应 用 程序 完全 透明 ， 利 用 SAN 虚拟 化 ， 用 户 和 应 用 程序 可 以 把 SAN 作 
为 一 个 单一 的 、 同 构 的 资源 池 来 存 取 和 控制 。 用 户 可 以 根据 不 同 应 用 系统 的 需要 对 这 个 
存储 池 进 行 任意 的 分 割 并 任意 的 分 配给 特定 的 主机 或 应 用 系统 ， 从 而 对 SAN 中 的 数据 进 
行 管理 、 保 护 、 使 用 和 操作 ， 对 设备 进行 监控 ， 充 分 发 挥 SAN 存储 潜能 。 

华为 0ceanStor S5500 V3 和 FusionStorage 将 存储 设备 组 织 成 一 个 类 似 SAN 设备 
的 虚拟 存储 池 ， 对 上 层 应 用 提供 存储 功能 ， 包 括 精 简 配 置 、 差 量 快照 和 链接 克隆 。 其 实 
现 结果 如 图 2-24 所 示 。 







| 
主机 内 核 空间 后 端 卷 挂 载 驱动 







计算 节点 


设备 驱动 层 


Ss ey 
华为 OceanStor S5500V3 


FusionStorage 
图 2-24 块 级 存储 虚拟 化 的 具体 结构 
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2.4.3 ”文件 级 虚拟 化 


文件 级 虚拟 化 的 典型 案例 是 分 布 式 文件 系统 。 连 接 数据 中 心中 成 百 上 千 个 存储 节点 
的 分 布 式 文件 系统 (如 Lustre、HDFS ) 需要 管理 整个 系统 中 所 有 存储 节点 上 的 文件 资源 ， 
从 而 把 分 布 式 存放 的 文件 资源 以 统一 的 视图 呈现 给 用 户 。 此 外 ， 分 布 式 文件 系统 还 需要 
隐藏 内 部 的 实现 细节 ， 对 用 户 和 应 用 程序 屏蔽 各 个 存储 节点 底层 文件 系统 之 间 的 差异 ， 
以 提供 给 用 户 统一 的 访问 接口 和 方便 的 资源 管理 方式 。 在 设计 分 布 式 文件 系统 时 ， 需 要 
关注 命名 空间 和 访问 接口 等 方面 。 

1: 命名 空间 

如 图 2-25 所 示 ， 在 分 布 式 存储 系统 中 ， 存 储 空间 又 被 进一步 划分 为 不 同 的 节点 空 
间 (Vnode )。Vnode 是 具备 基本 的 自我 管理 自我 组 织 的 底层 物理 文件 功能 单元 ， 是 管理 
存储 空间 上 各 种 迪 辑 资源 (如 Inode、 数 据 块 、 节 点 位 图 、 数 据 块 位 图 等 ) 的 逻辑 单位 。 
一 个 存储 节点 (如 ，NAS 设备 ) 上 的 存储 空间 可 视 为 节点 空间 Vnode。 借 助 节点 空间 ， 可 
以 实现 各 种 基于 策略 的 数据 组 织 , 例如 ， 系 统 可 以 将 多 个 节点 空间 组 织 成 线性 存储 空间 ， 
也 可 以 组 织 成 镜像 存储 空间 。 另 外 ， 可 以 根据 剩余 空间 变化 来 分 配 数据 份额 ， 以 平衡 空 
间 使 用 ， 也 可 以 根据 访问 频 度 将 负载 均衡 分 布 到 各 个 节点 空间 上 。 命 名 空间 可 以 采用 轻 
量 级 管理 方式 ， 即 每 个 节点 空间 维护 自己 的 目录 与 文件 树 结构 ， 而 虚拟 存储 服务 器 负责 
全 局 命名 空间 管理 。 特 别 的 ， 涉 及 到 目录 树 合并 点 (join point) 的 操作 完全 由 虚拟 存 
储 服务 器 负责 。 这 种 命名 空间 管理 方式 的 优势 是 能 够 减轻 服务 器 的 命名 服务 开销 ， 当 应 
用 涉及 目录 操作 时 ， 虚 拟 存储 服务 器 可 以 立即 进行 1ookup 操作 并 迅速 返回 请 求 结果 。 








节点 室 间 节点 空间 
图 2-25 命名 空间 逻辑 视图 
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2. 访问 接口 

用 户 最 终 通 过 文件 系统 提供 的 访问 接口 来 存 取 数 据 。 在 Linux 环境 下 ， 最 好 的 方案 
是 提供 可 移植 操作 系统 接口 (Portable 0perating System Interface of UNIX，POSIX) 
的 支持 ，P0SIX 标准 定义 了 操作 系统 应 该 为 应 用 程序 提供 的 接口 标准 ， 是 IEEE 为 要 
在 UNIX-like 操作 系统 上 运行 的 各 种 软件 而 定义 的 一 系列 API 标准 的 总 称 。 从 而 , 许 
多 上 层 应 用 (最终 都 进行 系统 调用 ) 不 加 修改 就 能 将 本 地 文件 存储 替换 为 分 布 式 文件 
存储 。 

如 果 想 让 文件 系统 支持 POSIX 接口 ,一 种 方式 是 按照 VFS 接口 规范 来 实现 文件 系统 ， 
这 种 方式 需要 文件 系统 开发 者 对 内 核 有 一 定 的 了 解 ; 另 一 种 方式 是 借助 FUSE 软件 , 在 用 
户 态 实现 文件 系统 并 支持 POSIX 接口 ,但 是 用 FUSE 软件 包 开 发 的 文件 系统 会 有 额外 的 用 
户 态 内 核 态 的 切换 、 数 据 拷贝 过 程 ， 从 而 导致 其 效率 不 高 。 另外 ， 在 客户 端 接口 的 支持 
上 ， 也 需 根 据 系统 需求 进行 权衡 ， 比 如 write 接口 ， 在 分 布 式 实现 上 较 麻 烦 ， 很 难 解决 
数据 一 致 性 的 问题 , 应 该 考虑 能 否 只 支持 create (update 通过 delete 和 create 组 合 实 
现 )， 或 折 中 支持 append， 以 降低 系统 的 复杂 性 。 
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本 章 首先 介绍 了 IT 系统 的 概念 ， 并 从 软件 资源 、 计 算 资源 、 网 络 资源 和 存储 资源 
的 角度 来 曾 述 IT 系统 架构 。 其 次 详细 描述 存储 系统 ， 从 1/0 访问 路 径 、 存 储 层次 结构 和 
文件 系统 等 方面 揭示 存储 系统 的 基本 操作 和 访问 原理 ， 然 后 重点 介绍 了 机 械 硬盘 和 固态 
硬盘 这 两 种 典型 的 存储 设备 ， 辨 析 两 种 硬盘 的 相关 特性 和 差异 ， 最 后 围绕 存储 管理 这 一 
主题 阐述 存储 虚拟 化 的 意义 及 相关 技术 。 





ee 
二 每 葬 7 3 

一 、 选 择 题 

1. 存储 在 数据 中 心 的 功能 有 (  ) 

A. 提供 海量 存储 B， 提 供 集 中 存储 

C. 提供 快速 IZ0 响应 D. 提供 计算 资源 

2. 根据 服务 器 的 形态 划分 ， 可 将 服务 器 分 为 (  ) 

A. 机 架 服务 器 B. 塔 式 服务 器 

C. 刀片 服务 器 D， 部 门 级 服务 器 


二 、 简 答题 
1. 机 械 硬 盘 的 主要 构件 有 哪些 ? 


2. 固态 硬盘 有 哪些 优势 ? 


3. 请 列 出 几 种 常见 的 文件 系统 〈 至 少 4 种 )， 并 加 以 介绍 。 
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3.1 存储 阵列 系统 

3.2 ”存储 阵列 高 可 靠 和 高 性 能 技术 
3.3 本章 小 结 

练习 题 





本 
vn 





随 着 网 络 信息 化 时 代 的 到 来 ， 智 能 终端 、 物 联网 、 云 计算 、 社 交 网 络 等 行业 飞速 发 
展 ， 数 据 呈 现 日 益 剧 增 趋势 ， 怎 样 安全 地 、 可 靠 地 存储 大 规模 数据 成 为 存储 系统 设计 的 
一 大 挑战 。 本 章 以 存储 阵列 为 例 ， 围 绕 存 储 容量 扩展 、 数 据 安全 性 、 数 据 可 靠 性 来 阐述 
存储 阵列 组 网 技术 。 


四 了。 了解 存储 阵列 基本 组 成 组 件 ; 
GE 3 。 掌 担 存储 阵列 级 联 组 网 方式 ; 
司 EE -3 。 掌 握 存 储 阵 列 扩 控 组 网 方式 ; 
标 。 ，。 了 解 存储 阵列 的 高 可 靠 技术 。 


人 





3.1.1 阵列 系统 基本 组 成 


互联 网 彻底 地 改变 了 当今 世界 人 们 的 生活 方式 ， 而 基于 互联 网 的 云 计算 及 物 联 网 技 
术 更 将 用 户 端 延展 至 任何 物品 ， 进 行 更 为 深入 的 信息 交换 和 通信 ， 从 而 达到 物 物 相 息 、 
万 物 互联 。 任 何事 物 都 不 能 孤立 于 其 他 群体 而 单独 存在 ， 存 储 系统 也 不 例外 ， 它 不 是 孤 
立 存在 的 ， 而 是 由 一 系列 组 件 共同 构成 的 。 常 见 的 存储 系统 有 存储 阵列 系统 、 网 络 附 加 
存储 、 磁 带 库 、 虚 拟 磁带 库 等 。 如 图 3-1 所 示 ， 存 储 系统 通常 分 为 硬件 架构 部 分 、 软 件 
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组 件 部 分 以 及 实际 应 用 过 程 中 的 存储 解决 方案 部 分 。 下 面 以 存储 阵列 系统 为 例 介绍 存储 
系统 组 成 。 





图 3-1 存储 系统 基本 组 成 


存储 阵列 系统 的 硬件 部 分 分 为 外 置 存 储 系 统 和 存储 连接 设备 。 外 置 存储 系统 主要 指 
实际 应 用 中 的 存储 设备 ， 比 如 磁盘 阵列 、 磁 带 库 、 光 盘 库 等 ， 存 储 连接 设备 包含 常见 的 
以 太 网 交换 机 、 光 纤 交 换 机 以 及 存储 设备 与 服务 器 或 者 客户 端 之 间 相 连接 的 线 费 。 

存储 阵列 系统 的 软件 组 件 部 分 主要 包含 存储 管理 软件 (如 LUN 创建 、 文件 系统 共享 、 
性 能 监控 等 )、 数 据 的 镜像 、 快 照 及 复制 模块 。 这 些 软件 组 件 的 存在 ， 不 仅 使 存储 阵列 系 
统 具备 高 可 靠 性 ， 而 且 降 低 了 存储 管理 难度 。 

存储 阵列 系统 的 存储 解决 方案 部 分 由 多 种 方案 组 成 ， 常 见 的 有 容 灾 解决 方案 和 备份 
解决 方案 。 一 个 设计 优秀 的 存储 解决 方案 不 仅 可 以 使 存储 系统 在 初期 部 署 时 安装 简易 、 
后 期 维护 便捷 ， 还 可 以 降低 客户 的 总 体 拥有 成 本 (Total Cost of 0wnership，TC0)， 保 
障 客户 的 前 期 投资 。 


3.1.2 ”存储 阵列 角色 位 置 


在 存储 系统 架构 中 ， 磁 盘 阵 列 充 当 数 据 存储 设备 的 角色 ， 为 用 户 业 务 系统 提供 数据 
存储 空间 ， 它 是 关系 到 用 户 业 务 稳定 、 可 靠 、 高 效 运作 的 重要 因素 。 下 面 以 常见 的 台式 
机 或 者 笔记 本 电脑 为 例子 ， 具 体 分 析 一 下 存储 阵列 在 存储 系统 架构 中 的 角色 位 置 。 

在 日 常生 活 中 ， 人 台式 机 或 笔记 本 电脑 是 人 们 经 常 使 用 的 工作 设备 。 在 台式 机 或 笔记 
本 电脑 中 ， 都 安装 有 独立 的 硬盘 ， 其 中 划分 了 一 部 分 硬盘 空间 作为 系统 分 区 ， 一 部 分 便 
盘 空 间 用 于 存储 用 户 数据 。 台 式 机 的 内 置 硬盘 一 般 是 采用 数据 线 连 接 到 主板 ;笔记 本 的 
内 置 硬 盘 一 般 通过 内 置 插 模 直接 与 主板 相连 接 。 此 外 ， 也 可 以 通过 外 置 USB 接口 等 方式 
进行 连接 。 当 通过 外 置 USB 接口 连接 时 ， 通 常 需要 借助 线 缆 来 实现 存储 功能 。 硬 盘 之 于 
台式 机 ， 正 如 存储 阵列 之 于 网 络 中 的 服务 器 。 如 图 3-2 所 示 ， 存 储 阵列 借助 线 缆 连 接 到 
服务 器 ， 再 由 服务 器 将 底层 存储 空间 提供 给 客户 端 〈 工 作 站 ) 使 用 ; 或 者 通过 交换 机 连 
接 到 服务 器 ， 再 通过 服务 器 将 底层 存储 空间 提供 给 客户 端 使 用 。 
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LAN 
服务 器 服务 器 
交换 机 

交换 机 






存储 阵列 
存储 阵列 


图 3-2 存储 阵列 组 网 图 


简 而 言 之 ， 存 储 阵列 在 整体 存储 系统 中 通常 充当 着 存储 设备 的 角色 ， 为 上 层 应 用 或 业 
务 系 统 提供 数据 存储 空间 。 存 储 阵列 的 基本 原理 和 实现 方式 可 参看 本 书 第 4 章 和 第 5 章 。 


3.1.3 ”存储 阵列 硬件 组 成 


机 械 硬 盘 内 部 构造 由 盘 片 、 主 轴 、 磁头 、 接 口 等 组 成 ,而 存储 阵列 也 有 其 内 部 构造 ， 
存储 阵列 有 两 种 结构 ， 一 种 是 硬件 由 控制 框 和 硬盘 框 两 部 分 组 成 ， 为 客户 提供 一 个 高 可 
靠 、 高 性 能 、 大 容量 的 智能 化 存储 平台 ; 男 一 种 是 控制 框 中 也 包含 硬盘 的 情况 ， 即 盘 控 
- 体 ， 在 盘 控 一 体 时 ， 硬 盘 框 并 不 是 必须 的 。 

控制 框 用 于 处 理 各 种 存储 业务 ， 并 管理 级 联 在 控制 框 下 面 的 硬盘 框 ， 其 外 观 如 图 3-3 
所 示 。 一 般 来 说 , 控制 框 里 面 的 控制 器 采用 的 是 双 控 的 模式 ， 即 A 控制 器 与 B 控 制 器 实现 元 
余 , 提升 性 能 以 及 可 靠 性 。 倘若 双 控 制 器 中 有 一 个 控制 器 出 现 物理 故障 ， 则 另外 一 个 控制 器 
可 以 通过 设置 在 用 户 无 感知 的 情况 下 接替 损坏 控制 器 运行 的 业务 , 保证 业务 的 正常 运行 。 











控制 器 B 





TRACE 
电池 备份 单元 ‘BBU) 


图 3-3 ”控制 框 
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便 盘 框 主要 用 于 容纳 各 种 人 硬盘, 为 应 用 服务 器 提供 充足 的 存储 空间 , 其 外 观 如 图 3-4 
所 示 。 











图 3-4 硬盘 框 


3.1.4 ”存储 阵列 级 联 组 网 


存储 阵列 中 一 个 控制 框 可 以 连接 多 个 硬盘 框 ， 控 制 框 与 硬盘 框 之 间 通 过 级 联 方 式 进 
行 连 接 ， 共 同 组 成 存储 阵列 硬件 系统 。 生 产 厂商 的 存储 阵列 产品 各 有 不 同 ， 为 了 更 好 地 
理解 存储 阵列 的 硬件 系统 ， 这 里 以 华为 0ceanStor 5300 V3 系列 存储 产品 为 例 ， 分 别 从 
其 控制 框 组 件 、 硬 盘 框 组 件 展现 其 构成 ”。 组 件 图 如 图 3-5、 图 3-6、 图 3-7 和 图 3-8 
所 示 。 





1 系统 插 框 2 硬盘 模块 3 电源 -BBU 模块 4 控制 器 
图 3-5 5300 V3 控制 框 组 件 
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硬盘 框 标签 

硬盘 模块 拉手 

硬盘 模块 卡 扣 

硬盘 模块 告警 、 定 位 指示 灯 
硬盘 模块 运行 指示 灯 
硬盘 托 架 

人 硬 枚 





[| 
by 
p= 





1 硬盘 模块 2 保险 箱 盘 标 识 3 整 机 标签 4 控制 框 ID 显示 器 
5 电源 指示 灯 / 开 关 按钮 6 硬盘 模块 卡 扣 


图 3-7 5300 V3 前 视图 





















电源 、BBU、 风 扁 一体 模块 


| 板 载 扣 卡 接口 ”| [USB 口 | 


配置 网 口 












管理 网 口 





图 3-8 5300 V3 后 面板 端口 


后 面板 各 端口 模块 作用 如 下 。 

。 ”电池 备份 单元 模块 (Battery Backup Unit，BBU) 能 够 在 系统 外 部 供电 失效 的 
情况 下 ， 提 供 后 备 电源 支持 ， 以 保证 存储 系统 中 业务 数据 的 可 用 性 ， 避 免 数据 

。 。 板 载 扣 卡 接口 支持 热 插 拔 ， 用 于 扩 控 组 网 。5300 V3 支持 4 个 GE 扣 卡 接口 。 

。 SAS 级 联 口 用 来 级 联 组 网 时 连接 硬盘 框 ， 包 括 EXP 级 联 端 口 和 PRI 级 联 端口 。 

。 ”接口 模块 是 应 用 服务 器 与 存储 系统 的 业务 接口 ， 用 于 接收 应 用 服务 器 发 出 的 数 
据 读 写 指令 。 接 口 模块 支持 热 插 拔 ， 支 持 8Gbit/s FC、16Gbit/s FC、12Gbit/s 
SAS、GE、10GE TOE、10GE FCoE 等 。 
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。 “USB 口 一 般 很 少 使 用 ， 故 障 时 可 以 通过 这 个 接口 拷贝 所 需 数据 以 及 向 控制 器 里 
面 添加 信息 。 

。 管理 网 口 支持 管理 员 访问 存储 系统 ， 对 存储 系统 进行 配置 和 管理 。 

。 ”维护 网 口 是 管 理 网 口 的 元 余 ， 用 于 紧急 情况 的 特殊 保护 。 

。 串口 通过 串口 线 缆 来 连接 维护 终端 ,通过 串口 可 以 对 存储 系统 进行 管理 与 维护 。 

级 联 组 网 的 规则 包括 以 下 几 点 。 

(1) 控制 器 A 上 的 级 联接 口 模块 连接 到 硬盘 框 的 级 联 模块 A， 控 制 器 B 上 的 级 联接 
口 模块 连接 到 硬盘 框 的 级 联 模块 B。 

(2) EXP 级 联 端口 和 PRI 级 联 端 口 是 做 硬盘 框 级 联 的 , 采用 mini SAS 线 缆 进行 连接 。 
存储 设备 上 的 所 有 EXP 级 联 端 口 只 能 与 PRI 级 联 端 口 相 连 ， 否 则 将 导致 业务 中 断 。 

(3) 同一 级 联 环 路 上 ， 高 密 硬盘 框 和 普通 硬盘 框 不 能 混 接 。 所 谓 高 密度 硬盘 框 是 指 
能 够 放置 许多 硬盘 的 硬盘 框 。 

(4) 如 果 级 联 两 个 或 两 个 以 上 数量 的 硬盘 框 ， 建 议 根据 控制 框 上 级 联 端 口 的 数量 组 
建 多 个 级 联 环 路 ， 每 个 级 联 环 路 上 的 硬盘 框 数量 尽量 保持 一 致 。 

(5) 硬盘 框 除了 与 控制 器 A 和 控制 器 B 直接 连接 外 ， 同 一 级 联 环 路 中 的 其 他 硬盘 框 
应 形成 两 个 相互 独立 、 互 为 元 余 的 链 路 ， 以 达到 最 佳 的 组 网 可 靠 性 。 

了 解 完 级 联 组 网 规则 以 后 ， 接 下 来 我 们 以 一 个 控制 框 级 联 两 个 硬盘 框 ， 一 个 控制 框 
级 联 三 个 硬盘 框 为 例 ， 分 别 展示 具体 的 组 网 连接 操作 ， 详 见 图 3-9 和 图 3-10。 








图 3-9 一 个 控制 框 级 联 两 个 硬盘 框 
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图 3-10 ”一 个 控制 框 级 联 三 个 硬盘 杠 


3.1.5 ”存储 阵列 扩 控 组 网 


随 着 企业 信息 化 进程 的 加 快 和 业务 规模 的 不 断 扩展 ， 业 务 数据 呈 几 何 级 数 不 断 增 
加 ， 存 储 系统 初期 的 配置 容量 可 能 已 无 法 满足 现 阶段 的 业务 发 展 需求 ， 存 储 系统 扩容 已 
经 成 为 企业 管理 者 越 来 越 关 注 的 问题 。 但 目前 传统 存储 的 总 体 扩展 能 力 有 限 ， 当 存储 系 
统 扩展 性 达到 最 大 限度 时 ， 必 须要 重新 购置 成 套 存 储 设备 来 满足 业务 发 展 的 需求 ， 同 时 
需要 将 原来 存储 系统 上 的 存储 业务 迁移 到 新 购置 的 存储 设备 上 ， 这 样 会 给 企业 和 带 来 高 昂 
的 运 维 成 本 ， 同 时 也 会 对 原 有 运行 业务 造成 较 大 影响 。 

存储 阵列 的 扩 控 组 网 技术 可 以 有 效 地 避免 这 一 难题 。 通 过 IP Scale-out 技术 将 多 
个 存储 控制 器 集合 在 一 起 ， 形 成 一 个 存储 集群 ， 集 群 内 所 有 的 硬盘 和 控制 器 对 外 提供 统 
一 的 界面 ， 共 用 所 有 的 存储 资源 。IP Scale-out 支持 存储 资源 的 弹性 扩展 ， 通 过 增加 更 
多 的 控制 器 和 后 端 硬 盘 ， 存储 资 源 随 之 增长 ， 而 运行 业务 不 受 影响 ， 既 节省 了 运 维 成 本 ， 
又 满足 了 企业 对 数据 日 益 增 长 的 需求 。 扩 控 组 网 技术 可 分 为 两 种 扩展 模式 ， 分 别 是 
Scale-up 和 Scale-outZ 。 


如 图 3-11 所 示 ，Scale-up 指 传统 的 纵向 扩展 架构 ， 即 利用 现 有 的 存储 系统 ， 通 过 
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不 断 增加 存储 器 件 ( 人 硬盘 、 内 存 ) 来 满足 用 户 日 益 增 长 的 需求 。 比 如 ， 办 公使 用 的 笔记 
本 电脑 ， 若 在 使 用 过 程 中 发 现 因 内存 不 够 ， 出 现 电脑 运行 不 畅 、 卡 顿 等 情况 ， 为 解决 此 
问题 ， 在 有 空闲 内 存 插 槽 的 情况 下 ， 购 置 新 内 存 条 并 加 入 内 存 插 模 供用 户 使 用 ， 当 硬盘 
空间 不 足 ， 可 以 通过 购置 新 硬盘 的 方式 来 实现 扩容 。 


Storage System 


Storage System 


Scale Up 
Ey 


Storage System 


Scale Out 
-> (CD) (Ce 


图 3-11 scale-up 和 scale-out 









Storage System 


Scale-out 指 横向 扩展 架构 ， 扩 展 通常 是 以 节点 〈 或 引擎 ) 为 单位 ， 通 过 增加 具有 
完整 功能 的 存储 节点 或 扩展 更 多 的 控制 器 来 满足 用 户 数据 增长 的 需求 。 

与 Scale-up 扩 控 组 网 技术 相 比 , Scale-out 则 在 实现 一 种 硬盘 容量 可 以 按 需 扩展 的 
网 络 存储 架构 。 当 给 定 的 节点 硬盘 容量 达到 存储 上 限时 ， 可 以 通过 添加 新 的 节点 以 扩展 
系统 容量 。 新 增 的 节点 和 原 有 节点 通过 交换 机 相连 ， 以 用 户 视角 来 看 ， 整 个 存储 系统 仍 
然 是 一 个 单一 的 系统 。 同 时 ，Scale-out 技术 依靠 多 个 控制 器 之 间 进 行 负载 平衡 及 容错 
处 理 等 来 提高 系统 的 处 理 能 力 和 可 靠 度 。 

如 果 企 业 使 用 未 支持 Scale-out 架构 的 存储 系统 ， 往 往 要 购买 大 量 的 存储 节点 ， 以 
确保 将 来 扩展 时 能 有 足够 的 硬盘 空间 。 随 着 企业 的 发 展 ， 如 果 扩 展 容量 比 预 期 的 要 少 得 
多 ， 那 么 原来 购买 的 硬盘 都 会 浪费 。 有 了 Scale-out 架构 ， 一 旦 存储 空间 的 需求 超出 预 
期 ， 可 以 添加 新 的 存储 节点 而 不 会 受到 限制 ， 并 且 新 添加 的 存储 节点 仍然 在 原 存 储 系 统 
下 统一 管理 。 

0ceanStor 5300 V3 存储 系统 采用 Scale-out 扩展 架构 ,引擎 之 间 通 过 IP 进行 互联 ， 
因此 ， 也 称 为 IP Scale-out。IP Scale-out 通过 整合 TCP/IP、RDMA 等 技术 ， 实 现 控制 
器 间 的 业务 交换 ， 符 合 数据 中 心 网 络 全 IP 化 的 技术 趋势 。 通 过 IP Scale-out 方式 进行 
扩容 有 以 下 特点 : (1) 每 个 通信 平面 为 两 条 互 为 元 余 的 通道 ; (2) 支持 系统 各 组 件 与 
通道 元 余 ， 实 现 故 障 检测 、 修 复 和 隔离 ， 确 保 系 统 稳定 运行 ; (3) 采用 IP 互联 可 以 为 
以 后 集群 的 扩展 预 留 空间 ， 更 适合 将 来 的 集群 弹性 扩展 ; (4) 通过 10GE 全 互联 设计 ， 


数据 存储 技术 


8 控 系 统 的 最 大 交换 带宽 可 达到 320Gbit/s; (5) 采用 业界 领先 的 RDMA 技术 ， 确 保 在 
交换 链 路 上 达到 hs 级 延 时 ， 同 时 保证 了 低 的 CPU 占用 ” 。 

IP Scale-out 扩 控 的 组 网 方式 有 两 种 : 直 连 方式 组 网 和 交换 机 方式 组 网 , 区 别 如 下 。 

交换 机 组 网 : 适用 于 所 有 扩 控 场景 ， 包 括 2 个 控制 器 扩展 到 4 个 控制 器 、2 个 控 
制 器 扩展 到 8 个 控制 器 、4 个 控制 器 扩展 到 6 个 控制 器 、4 个 控制 器 扩展 到 8 个 控制 
器 等 。 

直 连 组 网 ， 存 储 系 统 通过 直接 连 线 方 式 进行 扩 控 ， 只 适用 于 2 个 控制 器 扩展 到 4 个 
控制 场景 。 


3.2 “存储 阵列 高 可 靠 和 高 性 能 技术 


为 保证 数据 存 取 业 务 的 可 扩展 性 、 高 可 靠 性 和 高 性 能 ， 各 大 存储 厂商 围绕 存储 阵列 
开发 并 使 用 了 大 量 关键 技术 手段 。 下 面 分 别 介绍 存储 阵列 高 可 靠 性 技术 与 高 性 能 技术 。 


3.2.1 存储 阵列 高 可 靠 性 技术 


随 着 信息 化 进程 的 高 速 推进 ， 数 据 显得 越 来 越 重 要 ， 如 何 保证 数据 在 写 入 或 者 读 取 
过 程 中 不 丢失 ， 是 整体 布局 存储 阵列 组 网 需要 考虑 的 问题 。 下 面 将 围绕 存储 硬件 、 组 网 
方式 两 方面 对 存储 阵列 的 高 可 靠 性 技术 进行 剖析 。 

1.， 器 件 宛 余 

如 图 3-12 所 示 ， 存 储 阵 列 系统 实现 了 控制 器 模块 、 管 理 模块 、BBU 模块 (电池 备份 
单元 模块 )、 接 口 模块 、 电 源 模块 、 风 扇 模 块 等 部 件 的 匈 余 ， 极 大 保障 了 存储 系统 的 可 靠 
性 。 同 时 ， 通 过 采用 双 控 双 活 技术 ， 大 大 提升 了 存储 阵列 系统 的 数据 存 取 效率 。 












图 3-12 存储 阵列 器 件 元 余 


2. 存储 阵列 的 多 控 技 术 
阵列 多 控 技 术 指 一 个 阵列 部 署 多 个 控制 器 ,典型 案例 是 双 控 制 器 。 以 双 控 制 器 为 例 ， 
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当 一个 控制 器 出 现 物 理 故 障 时 ， 另 一 个 控制 器 可 以 在 用 户 无 感知 的 情况 下 接替 损坏 控制 
器 运行 的 业务 ， 保 证 业务 的 正常 运行 。 双 控制 器 系统 的 工作 模式 分 为 两 种 : 主 备 模式 
(Active Passive，AP) 和 双 活 模式 (Active Active，AA) Bo 。 

Active Passive 工作 模式 ， 简 称 AP 模式 也 被 称 为 主 备 模式 ， 即 任意 时 间 点 两 个 控 
制 器 中 只 有 一 个 控制 器 是 主 控制 器 ， 并 处 于 激活 状态 ， 主 控制 器 用 于 处 理 上 层 应 用 服务 
器 的 I/0 请 求 ; 而 男 外 一 个 作为 备用 控制 器 ， 处 于 空闲 等 待 状态 ， 当 主 控 制 器 出 现 故 障 
或 者 处 于 离线 状态 时 ， 备 用 控制 器 可 以 迅速 和 及 时 地 接管 主 控制 器 的 工作 。 

Active Active 工作 模式 ， 简 称 AA 模式 也 称 为 双 活 模式 ， 指 在 正常 时 两 个 控制 器 可 
以 并 行 地 处 理 来 自 应 用 服务 器 的 ,IT/0 请 求 ， 同 时 两 控制 器 处 于 激活 状态 不 分 主 次 。 当 故 
障 发 生 时 其 中 一 台 控 制 器 出 现 异 常 、 离 线 或 故障 ， 另 一 台 控 制 器 可 以 迅速 和 及 时 地 接管 
故障 控制 器 工作 ， 且 不 能 影响 自己 现 有 的 任务 。 基 于 以 上 ， 双 活 工作 模式 通过 控制 器 相 
互 见 余 备份 来 确保 存储 系统 的 高 可 用 性 和 高 可 靠 性 ， 而 且 具 有 提高 资源 利用 率 、 均 衡 业 
务 流量 、 提 升 存储 系统 性 能 等 多 方面 的 优点 。 

3. 多 路 径 技术 

如 图 3-13 左边 ， 多 台 服 务 器 主机 通过 一 台 交换 机 连接 到 存储 阵列 上 ， 当 交换 机 出 
现 故障 时 ， 主 机 和 存储 阵列 之 间 的 数据 传输 就 会 中 断 ， 数 据 传输 中 断 的 原因 在 于 主机 和 
存储 阵列 之 间 只 有 一 条 路 径 ， 存 在 单 点 故障 问题 。 所 谓 单 点 故障 是 指 任何 一 个 组 件 发 生 
故障 都 会 导致 整个 系统 无 法 工作 。 为 了 解决 单 点 故障 问题 ， 通 常 在 硬件 元 余 的 基础 上 采 
用 多 路 径 技术 。 

多 路 径 技 术 是 指 在 主机 和 存储 阵列 之 间 使 用 多 条 路 径 连接 ， 使 主机 到 阵列 的 可 见 路 
径 大 于 一 条 , 其 间 可 以 跨 过 多 个 交换 机 , 避免 在 交换 机 处 形成 单 点 故障 。 如 图 3-13 右边 ， 
主机 和 存储 阵列 通过 两 台独 立交 换 机 连接 在 一 起 ， 主 机 到 存储 阵列 的 可 见 路 径 有 2 条 ， 
即 (QD、@) 和 (@、 田 )。 在 这 种 模式 下 ， 当 路 径 中 断 开 时 ， 数 据 流 会 在 主机 多 路 径 软 
件 的 导 引 下 选择 路 径 〈@、 四 ) 到 达 存 储 阵 列 ， 同 样 在 左 侧 交换 机 失效 时 ， 也 会 自动 导 
引 到 右 侧 交换 机 到 达 存 储 阵 列 。 等 路 径 〈GD、 图 ) 恢复 后 ，I/0 流 会 自动 切 回 原 有 路 径 
下 发 。 整 个 切换 和 恢复 过 程 对 主机 应 用 透明 ， 完 全 避免 了 由 于 主机 和 阵列 间 的 路 径 故 障 
导致 I/0 中断。 在 图 3-13 右 图 中 ， 虽 然 避免 了 左 图 的 单 点 故障 问题 ， 但 会 带 来 多 路 径 问 
题 一 一 当 一 个 卷 通 过 两 条 或 者 两 条 以 上 的 链 路 映射 给 主机 使 用 时 ， 主 机 侧 挂 载 使 用 时 会 
识别 到 两 个 不 同 的 LUN ， 但 其 实 底层 存储 阵列 映射 的 LUN 只 有 一 个 。 对 于 这 个 问题 ， 通 
常 采 用 多 路 径 软件 来 处 理 。 

存储 系统 见 余 保护 方案 涉及 主机 到 存储 所 经 路 径 上 的 所 有 区 域 。 在 主机 侧 和 SAN 网 
络 区 域 ， 通 过 结合 UltraPath 多 路 径 软件 及 其 他 多 路 径 软 件 ”， 保 证 了 前 端 路 径 没 有 单 


”多 个 硬盘 构成 一 个 大 的 物理 卷 ， 在 物理 卷 的 基础 上 按照 指定 容量 创建 一 个 或 多 个 逻辑 单元 ， 这 些 单元 称 作 LUN。 
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点 故障 ; 在 存储 机 头 侧 ， 使 用 了 全 元 余人 硬件 及 热 插 拔 技术 实现 了 双 控 双 活 的 元 余 保 护 ; 
在 磁盘 侧 , 利用 磁盘 双 端 口技 术 及 磁盘 多 路 径 技术 , 实现 了 磁盘 侧 宛 余 保 护 。 以 图 3-13、 
图 3-14 和 图 3-15 为 例 来 详细 介绍 多 路 径 技 术 。 





<- 0 
\i1 
41/ 
存储 阵列 ses 存储 阵列 


图 3-13 存储 阵列 到 用 户 端 组 网 图 


图 3-14 所 示 为 简单 的 存储 设计 ， 它 存在 单 点 故障 问题 。 在 图 3-14 中 ， 主 机 通过 交 
换 机 连接 到 存储 设备 ， 连 接 主机 和 存储 设备 时 ， 
只 需要 2 根 缆 线 和 一 个 交换 机 。 主 机 本 身 是 一 
个 企业 级 的 设备 ， 配 置 了 双 电源 。 当 一 个 电源 
发 生 故 障 时 ， 另 一 个 正常 的 电源 继续 供电 ， 保 一 六 Ri 
证 主机 的 正常 运行 。 然 而 这 种 设计 无 法 获得 足 
够 高 的 可 靠 性 ， 只 要 主机 网 卡 、 缆 线 、 交 换 机 、 
存储 控制 器 中 任 一 组 件 出 现 问题 ， 主 机 和 存储 x HOMNOD | saw 
设备 之 间 的 数据 传输 都 将 中 断 。 
在 图 3-15 硬件 宛 余 组 网 设计 中 , 几乎 所 有 | 
的 硬件 都 有 元 余 ， 所 以 当 部 分 硬件 发 生 故 障 控制 器 + 接口 
时 ， 至 少 仍然 会 有 一 条 从 主机 到 存储 设备 的 路 [DR TDRR TDRR Dr 
[bs | Disk | Disk | bsk | 
各 可 用 。 isk | os | ps | Disk | 
ddl, bbe 图 3-14 硬件 元 余 组 网 图 1 
备 上 的 同一 个 卷 〈 卷 是 存储 卷 管理 器 ， 它 是 操 
作 系 统 中 的 一 个 对 象 ， 主 要 负责 存储 块 设备 的 在 线 管理 ) 在 主机 端 将 呈现 多 个 卷 信息 。 
宛 余 路 径 设计 会 给 大 多 数 的 操作 系统 带 来 混乱 。 在 图 3-16 中 ， 用 虚线 标记 的 链 路 是 4 
条 独立 的 从 主机 到 存储 设备 的 链 路 ， 当 存储 设备 中 的 一 个 LUN 映射 给 主机 后 ， 由 于 主机 
到 存储 设备 的 4 条 虚线 链 路 是 独立 的 ， 因 此 在 主机 端 将 会 看 到 4 个 独立 的 LUN， 这 种 混 
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乱 的 情况 我 们 称 之 为 多 路 径 问题 。 





| Disk | Disk | Disk | Disk | 
| Disk | Disk | Disk | Disk | 
图 3-15 ”硬件 元 余 组 网 图 2 

主机 到 存储 之 间 的 I/0 有 多 条 路 径 可 以 选择 ， 如 果 多 条 路 径 同 时 使 用 的 话 ，IV0 流 
量 如 何 分 配 ? 其 中 一 条 路 径 坏 掉 了 , 如 何 处 理 ? 另外 , 操作 系统 认为 每 条 路 径 连 接 的 LUN 
是 一 个 实际 存在 的 物理 盘 ， 但 实际 上 多 条 路 径 都 通 向 同一 个 物理 盘 ， 用 户 使 用 时 无 法 识 
别 。 为 解决 上 述 问 题 ， 需 要 采用 多 路 径 软 件 。 由 于 多 路 径 软件 需要 和 存储 一 起 配合 使 用 ， 
最 好 使 用 相应 存储 厂商 开发 的 多 路 径 软件 。 有 些 存储 厂商 免费 提供 多 路 径 软 件 ， 比 如 华 
为 公司 为 其 旗下 存储 产品 提供 了 免费 的 多 路 径 软件 ， 有 些 存 储 厂商 要 求 用 户 付费 使 用 多 
路 径 软件 ， 比 如 EMC 公司 的 基于 Linux 多 路 径 软件 需要 单独 购买 License。 许 多 操作 系 
统 自 带 了 免费 的 多 路 径 软 件 包 ， 如 Linux 提供 的 多 路 径 软件 是 一 个 比较 通用 的 软件 包 ， 
支持 大 多 数 存储 厂商 的 设备 。 

以 图 3-16 所 示 的 硬件 元 余 存 储 阵列 组 网 为 例 ， 主 机 和 存储 阵列 之 间 存 在 4 条 访问 
路 径 , 在 未 安装 多 路 径 软 件 时 , 主机 侧 识别 到 4 个 100GB 的 物理 盘 (LUN 空间 ), 如 图 3-17 
所 示 。 

安装 多 路 径 软 件 后 , 主机 侧 只 识别 到 一 个 1006B 的 物理 盘 ( 即 LUN 空间 ), 如 图 3-18 
所 示 。 之 所 以 解决 多 路 径 问 题 ， 原 因 在 于 多 路 径 软件 能 通过 识别 设备 的 WWN 号 来 判定 底 
层 的 LUN 空间 。WWN 是 设备 的 唯一 标识 ， 通 常 由 48 位 或 64 位 数字 组 成 ， 相 当 于 网 卡 的 
MAC 地 址 ， 是 全 球 唯 一 的 。 以 图 3-16 为 例 ， 存 储 设备 上 只 有 一 个 LUN， 由 于 主机 到 存储 
设备 有 多 条 链 路 ， 在 主机 上 挂 载 使 用 时 ， 主 机 上 会 呈现 多 个 磁盘 。 而 多 路 径 软件 能 够 通 
过 识别 底层 设备 的 WWN 号 来 屏蔽 这 些 磁盘 ， 只 生成 一 个 虚拟 磁盘 。 
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图 3-16 ”硬件 元 余 组 网 图 3 
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图 3-17 未 安装 多 路 径 在 主机 侧 识别 到 的 LUN 空间 
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图 3-18 ”安装 完 多 路 径 在 主机 侧 识别 到 的 LUN 空间 
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多 路 径 软件 不 仅 能 够 避免 同一 LUN 有 多 条 路 径 可 达 而 导致 的 操作 系统 罗 辑 错误 ， 而 
且 能 够 增强 链 路 的 可 靠 性 ， 避 免 单个 链 路 故障 而 导致 的 系统 故障 。 
多 路 径 软 件 还 能 提供 如 下 功能 : 
。 最 优 路 径 选择 : 选择 多 条 路 径 中 的 最 佳 路 径 ， 获 取 最 佳 的 性 能 ; 
e。 路 径 I/0 负载 均衡 : 自动 选择 多 条 路 径 进 行 1/0 的 下 发 ， 提 高 I[/0 性 能 ， 并 根 
据 路 径 繁忙 程度 进行 业务 路 径 选 择 ; 
。 ”自动 故障 切换 : 业务 链 路 发 生 故 障 时 ， 进 行 故障 切换 (Failover)， 确 保 业 务 不 
中 断 ; 
。 ”自动 故障 恢复 : 等 故障 之 前 的 业务 链 路 恢复 后 , 自动 触发 业务 恢复 (Failback)， 
用 户 无 需 介 入 ， 且 业务 不 中 断 。 
4. 数据 保险 箱 盘 技 术 
数据 保险 箱 技术 是 一 种 保障 高 可 靠 性 的 技术 ， 主 要 用 于 保存 高 速 缓存 〈Cache) 数 
据 、 系 统 配置 信息 和 告警 日 志 信息 ， 有 效 地 避免 因 系统 意外 断 电 而 导致 的 数据 丢失 问题 。 
保险 箱 盘 的 工作 原理 : 当 系 统 掉 电 时 ， 由 电池 备份 单元 (BBU) 供电 ， 主 机 如 果 有 
数据 写 进 来 ， 就 将 这 些 数 据 写 入 保险 箱 盘 ， 当 系统 供电 恢复 时 ， 将 保存 在 保险 箱 盘 的 数 
据 刷 新 到 数据 盘 中 。 
保险 箱 盘 用 于 存放 系统 重要 数据 和 电源 模块 发 生 故 障 时 Cache 中 的 数据 。 一 方 
面 ， 它 可 以 永久 性 地 保存 系统 掉 电 后 Cache 中 的 数据 ,为 系统 提供 强 有 力 的 可 靠 性 保障 ; 
另 一 方面 ， 它 还 可 以 存放 系统 的 配置 数据 和 告警 日 志 等 关键 信息 。 不 管 是 系统 掉 电 后 
Cache 中 的 数据 ， 还 是 系统 配置 数据 或 者 告警 日 志 信息 ， 对 于 一 个 存储 系统 来 说 ， 都 是 
非常 重要 的 , 因此 需要 保证 保险 箱 盘 的 可 靠 性 .对 此 , 数据 保险 箱 中 的 多 块 硬盘 采用 RAID 
1 宛 余 配置 ， 存 入 保险 箱 的 数据 中 会 保存 两 份 完全 相同 的 副本 ， 即 使 保险 箱 内 某 个 硬盘 
出 现 故障 ， 在 更 换 硬 盘 后 ， 保 险 箱 将 使 用 数据 恢复 机 制 自 动 将 数据 完整 地 恢复 到 新 硬盘 
上 ， 整 个 操作 完全 在 线 进行 ， 不 影响 业务 系统 。 当 系统 意外 掉 电 时 ， 系 统 将 Cache 中 的 
数据 、 系 统 配置 信息 和 告警 日 志 数据 存放 到 保险 箱 盘 中 ， 确 保 数 据 不 丢失 。 当 恢复 供电 
后 ， 系 统 会 将 数据 保险 箱 盘 中 的 数据 复制 到 原来 位 置 ， 保 持 数据 一 致 性 。 
保险 箱 盘 可 以 当 作 成 员 盘 使 用 ， 因 为 用 于 保险 箱 盘 空间 和 用 于 业务 成 员 盘 空间 是 相 
互 独立 的 。 比 如 华为 0ceanStor V3 系列 保险 箱 的 各 个 盘 只 占用 56GB， 剩 余 空 间 可 以 用 来 
存放 业务 数据 。 
5. RATD 重 构 技术 
RAID 重 构 技 术 用 于 RAID 组 中 的 数据 恢复 , RAID 重 构 技术 是 指 当 RAID 组 中 某 个 
磁盘 发 生 故 障 时 ， 根 据 RAID 中 的 奇偶 校 验算 法 或 镜像 策略 ， 利 用 其 他 正常 成 员 盘 
的 数据 ， 重 新 生成 故障 磁盘 数据 的 方法 。 重 构 内 容 包 括 用 户 数据 和 校 验 数据 ， 最 终 
将 这 些 数据 写 到 热 备 盘 或 者 替换 的 新 磁盘 上 。 本 书 第 4 章 和 第 5 章 对 RAID 重 构 有 
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详细 的 介绍 。 

6. 硬盘 预 拷贝 技术 

预 拷贝 技术 一 般 是 在 RAID 组 中 体现 ， 它 可 以 利用 硬盘 自身 的 检测 功能 ， 预 测 正 在 
工作 的 硬盘 即将 出 现 故 障 ， 在 出 现 故 障 之 前 将 数据 拷贝 到 新 的 硬盘 中 。 预 拷贝 是 磁盘 阵 
列 的 一 种 数据 保护 方式 ， 能 有 效 降低 数据 丢失 风险 ， 大 大 减少 重 构 事件 发 生 的 概率 ， 提 
高 系统 的 可 靠 性 。 具 体 地 ， 预 拷贝 过 程 包括 三 个 主要 步骤 :(1) 正常 状态 时 ， 实 时 监控 
磁盘 状态 ; (2〉 当 某 个 磁盘 疑似 出 现 故 障 时 ， 将 该 盘 上 的 数据 拷贝 到 热 备 租 上; (3) 找 
贝 完 成 后 , 车 有 新 盘 蔡 换 故 障 盘 时 , 再 将 数据 迁移 回 新 盘 上 。 预 拷贝 技术 在 第 4 章 的 RAID 
保护 技术 中 有 详细 的 介绍 。 
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传统 RAID 技术 以 硬盘 为 单位 来 构建 RAID 组 ， 而 以 磁盘 为 单位 的 数据 管理 无 法 有 效 
地 保障 数据 访问 性 能 。 一 方面 ， 组 成 一 个 RAID 组 的 磁盘 数 过 少 ， 另 一 方面 ， 一 个 LUN 
往往 来 自 于 一 个 RAID 组 , 当主 机 对 一 个 LUN 进行 密集 式 I/0 访问 时 , 只 能 访问 到 有 限 的 
几 个 磁盘 ， 容 易 导 致 磁盘 访问 瓶颈 。 为 了 提高 存储 阵列 的 访问 性 能 ， 提 出 了 几 种 高 性 能 
技术 。 

1. 分 层 存储 

通过 Scale-out 扩 控 组 网 ， 存 储 阵 列 可 以 扩展 到 更 大 规模 ， 包 含 的 磁盘 个 数 可 以 达 
到 上 百 个 ， 还 可 以 包含 多 种 类 型 的 磁盘 。 为 了 充分 发 挥 存储 资源 效用 ， 可 以 采用 分 层 存 
储 技术 。 分 层 存储 技术 首先 将 不 同 的 存储 设备 进行 分 级 管理 ， 形 成 多 个 存储 级 别 〈“ 如 高 
性 能 层 、 性 能 层 、 容 量 层 ); 然后 根据 数据 访问 频 度 将 数据 迁移 到 相应 级 别 的 存储 中 ， 将 
访问 频率 高 的 热 数 据 迁 移 到 高 性 能 的 存储 层级 ， 将 访问 频率 低 的 冷 数据 迁移 到 低 性 能 大 
容量 的 存储 层级 。 一 方面 , 将 极 少 使 用 的 大 部 分 数据 迁移 到 低 性 能 、 大 容量 的 存储 层级 ， 
减少 冷 数 据 对 系统 资源 的 占用 ; 另 一 方面 ， 将 频繁 使 用 的 一 小 部 分 数据 迁移 到 高 性 能 、 
低 容量 的 存储 层级 ， 提 高 存储 系统 的 总 体 性 能 。 

一 般 来 讲 ， 不 同类 型 的 磁盘 对 应 一 个 存储 层级 , “SSD 盘 对 应 高 性 能 层 ，SAS 盘 分 配 
到 性 能 层 ; SATA 盘 则 分 配 到 容量 层 。 存 储 层 级 主要 是 用 于 管理 不 同性 能 的 存储 介质 ， 以 
便 为 不 同性 能 要 求 的 应 用 提供 不 同性 能 的 存储 空间 。 高 性 能 层 适 合 那些 访问 频率 高 、 重 
要 的 程序 和 文件 ， 其 优点 是 存 取 速 度 快 、 性 能 好 ， 满 足 高 效 访问 的 数据 访问 需求 ， 性 能 
较 高 的 性 能 层 用 于 存放 访问 频 度 中 等 的 数据 ;容量 层 适 合 存放 大 容量 的 数据 以 及 访问 频 
度 较 低 的 数据 。 

2. Cache 技术 

闪存 Cache 主要 用 于 提升 存储 访问 效率 。 以 华为 技术 有 限 公 司 的 SmartCache 为 
例 ，SmartCache 又 叫 智能 数据 缓存 。 利 用 SSD 盘 对 随机 小 I/0 读 取 速 度 快 的 特点 ， 
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通过 SSD 盘 组 成 智能 缓存 池 , 将 访问 频率 高 的 随机 小 1/0 热点 读数 据 从 传统 的 机 械 硬 
盘 复 制 到 由 SSD 盘 组 成 的 高 速 智能 缓存 池 中 。 由 于 SSD 盘 的 数据 读 取 速度 远 远 高 于 机 
械 硬 盘 ， 所 以 SmartCache 特性 可 以 缩短 访问 频 度 高 的 数据 的 响应 时 间 ， 从 而 提升 系 
统 的 性 能 。 

SmartCache 将 智能 缓存 池 划分 成 多 个 分 区 ,为 业务 提供 细 粒 度 的 SSD 缓存 资源 。 
不 同 的 业务 可 以 共享 同一 个 分 区 ， 也 可 以 分 别 使 用 不 同 的 分 区 ， 各 个 分 区 之 间 互 不 
影响 ， 从 而 可 以 向 关键 应 用 提供 更 多 的 缓存 资源 ， 保 障 关键 应 用 的 性 能 。 特 别 地 ， 
利用 SSD 盘 较 短 的 响应 时 间 和 较 高 的 IOPS 特性 ，SmartCache 特性 可 以 提高 业务 的 
读 性 能 。SmartCache 适用 于 存在 热点 数据 ， 且 读 操作 多 于 写 操作 的 随机 小 I/0 业务 
场景 。 

3， 块 虚拟 化 

传统 RAID 技术 受到 磁盘 数 的 限制 ， 性 能 差 且 难以 扩展 ， 已 经 越 来 越 无 法 满足 业 
务 的 需求 。 一 方面 ， 组 成 一 个 RAID 组 的 磁盘 数 过 少 ， 另 一 方面 ， 一 个 LUN 往往 来 自 
于 一 个 RAID 组 ， 因 此 ， 当 主机 对 一 个 LUN 进行 密集 式 1/0 访问 时 ， 只 能 访问 到 有 限 


技术 ( 即 RAID2. 0+, 具体 参看 第 5 章 ), 它 将 硬盘 划分 成 若干 固定 大 小 的 逻辑 块 (CK)， 
然后 将 其 组 合成 逻辑 块 组 (CKG)。 组 建 RAID 组 不 再 以 硬盘 为 单位 ， 而 以 逻辑 块 为 单 
位 。 块 虚拟 化 技术 支持 单个 LUN 跨越 更 多 的 物理 磁盘 ,充分 发 挥 存储 系统 的 数据 处 理 
能 力 。 某 一 硬盘 失效 时 ， 存 储 池 内 的 其 他 硬盘 都 会 参与 重 构 ， 消 除 传统 RAID 下 的 重 
构 性 能 瓶颈 ， 提 高 了 重 构 数 据 的 速度 。 

RAID2. 0+ 支 持 更 细 粒 度 〈 可 以 达 几 十 KB 粒度 ) 的 资源 颗粒 ， 如 ， 存 储 系统 按照 用 
户 设置 的 “数据 迁移 粒度 ”将 CKG 划分 为 更 小 的 Extent， 在 此 基础 上 构成 了 一 个 统一 的 
存储 资源 池 。 若 干 Extent 组 成 了 用 户 需 要 使 用 的 LUN。 在 存储 系统 中 申请 空间 、 释 放空 
间 、 迁 移 数据 都 是 以 Extent 为 单位 进行 的 。 从 而 ， 基 于 存储 池 创 建 的 LUN 不 再 受 限 于 
RAID 组 磁盘 数量 ， 单 个 LUN 上 的 数据 可 以 分 布 到 相同 类 型 或 不 同类 型 的 磁盘 上 ， 有 效 避 
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本 章 内 容 涵 盖 存 储 阵列 系统 和 存储 阵列 技术 两 方面 。 具体 地 , 在 存储 阵列 系统 方面 ， 
概述 了 存储 阵列 系统 基本 组 件 的 作用 ， 分 析 了 存储 阵列 在 存储 系统 架构 中 的 位 置 ， 详 细 
介绍 了 存储 阵列 间 的 级 联 组 网 、 扩 控 组 网 方式 ;在 存储 阵列 技术 方面 ， 分 别 列举 了 多 种 
高 可 靠 性 技术 和 高 性 能 技术 。 
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一 、 判 断 题 

1. 存储 阵列 控制 框 主要 由 控制 嚣 模块、 风扇 -BBU 模块 、 电 源 模块 以 及 接口 模块 等 
组 成 ， 是 存储 系统 的 核心 部 件 。( ) 

2. 存储 阵列 的 内 置 BBU 电池 可 保证 在 系统 意外 断 电 时 ， 对 Cache 和 硬盘 框 同 时 供 
电 ， 让 Cache 中 的 数据 写 到 人 硬盘 中 ， 实 现 Cache 数据 永久 保存 。( ) 

二 、 思 考题 

1， 如 何 解决 在 实施 过 程 中 的 多 路 径 问题 ? 


2. 多 路 径 软 件 有 哪些 功能 ? 


3. 存储 技术 组 网 为 什么 要 采用 正 反 向 级 联 的 方式 来 连接 ? 


4. 存储 阵列 扩 控 组 网 技术 中 ，Scale-out 与 Scale-up 有 何 区 别 ? 
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自 20 世纪 80 年 代 以 来 ，CPU 处 理性 能 的 提升 速度 远 高 于 磁盘 驱动 器 的 读 写 速度 
的 增长 率 ， 两 者 性 能 上 的 不 匹配 严重 制约 了 系统 整体 性 能 的 提升 ， 而 RAID 技术 的 出 
现 很 好 地 缓解 了 这 一 矛盾 。RAID 通过 使 用 多 磁盘 并 行 存 取 数据 来 大 幅 提高 数据 吞吐 
率 ; 另外 ， 通 过 数据 校 验 ，RAID 可 以 提供 容错 功能 ， 提 高 存储 数据 的 可 用 性 。 目 前 ， 
RAID 已 成 为 保障 存储 性 能 和 数据 安全 性 的 一 项 基本 技术 。 本 章 主 要 讲述 传统 RAID 技 
术 的 相关 知识 。 


a SS 9 e 了 解 传统 RAID 关键 技术 及 等 级 划分 ; 
] Si。 掌握 各 类 RAID 的 实现 原理 ; 
目 C 3。 掌 握 RAID 的 数据 保护 技术 ; 


水 c 。 了解 RAID、LUN 以 及 逻辑 考 之 间 关 系 。 










在 传统 的 计算 机 存储 系统 中 ， 存 储 工 作 通常 是 由 计算 机 内 置 的 磁盘 来 完成 的 ， 采 用 
这 种 内 置 存储 方式 容易 引起 性 能 、 容 量 扩展 性 、 可 靠 性 等 方面 的 问题 。 

(1) 不 利于 扩容 ， 一 方面 ， 由 于 机 箱 空间 有 限 ， 硬 盘 数 量 的 扩展 受到 了 限制 ， 导 致 
存储 容量 受到 限制 ， 另 一 方面 ， 机 箱 满载 的 情况 下 需要 扩容 ， 只 能 通过 添 购 服务 器 的 方 
式 实现 ， 扩 容 成 本 高 。 
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(2) 不 利于 资源 共享 ， 数 据 存 在 于 不 同 服务 器 挂 接 的 磁盘 上 ， 不 利于 共享 和 备份 。 

(3) 影响 业务 连续 性 ， 当 需要 更 换 硬盘 (如 硬盘 失效 ) 或 增加 硬盘 〈 如 扩容 ) 时 ， 
需要 切断 主机 电源 ， 主 机 上 业务 系统 只 能 中 断 。 

(4) 可 靠 性 低 ， 机 箱 内 部 的 硬盘 相互 独立 ， 多 个 磁盘 上 的 数据 没有 采用 相关 的 数据 
保护 措施 ， 坏 盘 情 况 下 数据 丢失 的 风险 大 。 

(5) 存储 空间 利用 率 低 ， 一 台 主 机 内 置 一 块 或 几 块 容量 较 大 的 硬盘 ， 而 自身 业务 在 
只 需 很 小 存储 空间 的 情况 下 ， 其 他 主机 也 无 法 利用 这 些 闲 置 的 空间 ， 造 成 了 存储 资源 的 
浪费 。 

(6) 内 置 存 储 直 接 通 过 总 线 与 内 存 相连 ， 占 用 总 线 资源 ， 影 响 主机 性 能 。 

随 着 大 型 计算 、 海 量 数据 存储 的 发 展 ， 应 用 对 计算 能 力 、 数 据 存 储 资 源 方面 都 有 了 
更 高 的 要 求 , 计算 机 内 置 存储 已 经 无 法 满足 各 类 应 用 对 存储 性 能 、 容 量 、 可 靠 性 的 需求 。 
为 了 克服 内 置 存储 存在 的 扩容 性 差 这 一 问题 ， 人 们 把 磁盘 从 机 箱 里 面 挪 到 了 机 箱 外 面 ， 
通过 SCSI 总 线 将 主机 与 外 置 磁盘 连接 起 来 , 进而 通过 扩展 磁盘 数量 获得 足够 大 的 存储 容 
量 , 这 也 是 RAID 技术 的 设计 初衷 。 后 来 随 着 磁盘 技术 的 不 断 发 展 ， 单 个 磁盘 容量 不 断 增 
大 , 构建 RAID 的 目的 已 不 限于 构建 一 个 大 容量 磁盘 , 而 是 利用 并 行 访问 技术 和 数据 编码 
方案 来 分 别提 高 磁盘 的 读 写 性 能 和 数据 安全 性 。 

磁盘 阵列 (Redundant Array of Independent Disks，RAID) 的 全 称 是 独立 元 余 磁 
得 阵 列 , 最 初 是 美国 加 州 大 学 伯克利 分 校 于 1987 年 提出 的 , 它 将 两 个 或 两 个 以 上 单独 的 
物理 磁盘 以 不 同 的 方式 组 合成 一 个 逻辑 盘 组 ””" 。RAID 技术 的 优势 主要 体现 在 三 个 方 
面 : (1) 将 多 个 磁盘 组 合成 一 个 逻辑 盘 组 ， 以 提供 更 大 容量 的 存储 ; (2) 将 数据 分 割 成 
数据 块 ， 由 多 个 磁盘 同时 进行 数据 块 的 写 入 / 读 出 ， 以 提高 访问 速度 (3) 通过 数据 镜像 
或 奇偶 校 验 提供 数据 元 余 保护 ， 以 提高 数据 安全 性 。 

实现 RAID 主要 有 两 种 方式 : 软件 RAID 和 硬件 RAID。 

(1) 基于 软件 的 RAID 技术 

通过 在 主机 操作 系统 上 安装 相关 软件 实现 ， 在 操作 系统 底层 运行 RAID 程序 ， 将 识 
别 到 的 多 个 物理 磁盘 按 一 定 的 RAID 策略 虚拟 成 逻辑 磁盘 ; 然后 将 这 个 逻辑 磁盘 映射 给 
磁盘 管理 器 ， 由 磁盘 管理 器 对 其 进行 格式 化 。 上 层 应 用 可 以 透明 地 访问 格式 化 后 的 逻辑 
磁盘 ， 察 觉 不 到 逻辑 磁盘 是 由 多 个 物理 磁盘 构成 。 上 述 所 有 操作 都 是 依赖 于 主机 处 理 器 
实现 的 ， 软 件 RAID 会 占用 主机 CPU 资源 和 内 存 空间 ， 因 此 ， 低 速 CPU 可 能 无 法 实施 ， 软 
件 RAID 通常 用 于 企业 级 服务 器 。 但 是 ， 软 件 RAID 具有 成 本 低 、 配 置 灵 活 、 管 理 方便 等 
优势 。 

(2) 基于 硬件 的 RAID 技术 

通过 独立 硬件 来 实现 RAID 功能 ， 包 括 采 用 集成 RAID 芯片 的 SCSI 适 配 卡 〈 即 RAID 
卡 ) 或 集成 RAID 芯片 的 磁盘 控制 器 〈 即 RAID 控制 器 )。RAID 适 配 卡 和 RAID 控制 器 都 拥 
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有 自己 独立 的 控制 处 理 器 、I/0 处 理 芯 片 、 存 储 器 和 RAID 芯片 。 硬 件 RAID 采用 专门 RAID 
芯片 来 实现 RAID 功能 ， 不 再 依赖 于 主机 CPU 和 内 存 。 相 比 软 件 RAID， 硬 件 RAID 不 但 释 
放 了 主机 CPU 压力 ， 提 高 了 性 能 ， 而 且 操作 系统 也 可 以 安装 在 RAID 虚拟 磁盘 之 上 ,能 

进行 相应 的 元 余 保 护 。 


4.2 RAID 技术 


4.2.1 关键 技术 


由 4.1 节 可 知 ，RAID 技术 除了 可 以 提供 大 容量 的 存储 空间 ， 还 可 以 提高 存储 性 能 和 
数据 安全 性 。 那 么 它 如 何 能 在 提高 读 写 性 能 的 同时 保证 数据 安全 性 呢 ? 主要 原因 在 于 
RAID 采用 了 数据 条 带 化 这 一 高 效 数 据 组 织 方 式 以 及 奇偶 校 验 这 一 数据 元 余 策 略 。 

RAID 引入 了 条 带 的 概念 ”"”。 如 图 4-1 所 示 ， 条 带 单元 (Stripe Chit) 是 指 磁盘 
中 单个 或 者 多 个 连续 的 扇 区 的 集合 ， 是 单 块 磁盘 上 进行 一 次 数据 读 写 的 最 小 单元 。 条 带 
(Stripe) 是 同一 磁盘 阵列 中 多 个 人 磁盘 驱动 器 上 相同 “位 置 ” 的 条 带 单元 的 集合 ， 条 带 单 
元 是 组 成 条 带 的 元 素 。 条 和 带宽 度 是 指 在 一 个 条 带 中 数据 成 员 盘 的 个 数 ， 条 带 深度 则 是 指 
一 个 条 带 单元 的 容量 大 小 。 


> | NE 
- 通 - 站 


图 4-1 数据 组 织 方式 “ 





通过 对 磁盘 上 的 数据 进行 条 带 化 ， 实 现 对 数据 成 块 存 取 ， 可 以 增强 访问 连续 性 ， 有 
效 减少 磁盘 的 机 械 寻 道 时 间 ， 提 高 数据 存 取 速度 。 此 外 ， 通 过 对 磁盘 上 的 数据 进行 条 带 
化 , 将 连续 的 数据 分 散 到 多 个 磁盘 上 存 取 , 实现 同一 阵列 中 多 块 磁盘 同时 进行 存 取 数 据 ， 
提高 了 数据 存 取 效 率 ( 即 访问 并 行 性 )。 并 行 操作 可 以 充分 利用 总 线 的 带宽 ， 显著 提高 磁 
盘整 体 存 取 性 能 。 

因为 采用 了 数据 条 带 化 组 织 方式 ， 使 得 RAID 组 中 多 个 物理 磁盘 可 以 并 行 或 并 发 地 
响应 主机 的 I/0 请 求 ， 进 而 达到 提升 性 能 的 目的 。 这 里 的 1/0 是 输入 〈Input ) 和 输出 
(0utput) 的 缩写 ， 输 入 和 输出 分 别 对 应 数据 的 写 和 读 操 作 。 并 行 是 指 多 个 物理 磁盘 同时 
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响应 一 个 I/0 请 求 的 执行 方式 ， 而 并 发 则 是 指 多 个 物理 磁盘 一 对 一 同时 响应 多 个 I/0 请 
求 的 执行 方式 。 

RAID 通过 镜像 和 奇偶 校 验 的 方式 对 磁盘 数据 进行 元 余 保 护 。 镜像 是 指 利 用 匈 余 的 磁 
得 保存 数据 的 副本 ， 一 个 数据 盘 对 应 一 个 镜像 备份 盘 ， 奇偶 校 验 则 是 指 用 户 数据 通过 奇 
偶 校 验算 法 计算 出 奇偶 校 验 码 ， 并 将 其 保存 于 额外 的 存储 空间 。 奇 偶 校 验 采 用 的 是 异 或 
运算 (运算 符 为 @) 算法 。 奇 偶 校 验 具体 过 程 如 图 4-2 所 示 ，0@0=0，0@1=1，1@0=1， 
1@1=0， 即 ， 运 算 符 两 边 数据 相同 则 为 假 〈 等 于 0)， 相 异 则 为 真 ( 等 于 1)。 





图 4-2 数据 奇偶 校 验 


通过 镜像 或 奇偶 校 验方 式 ， 可 以 实现 对 数据 的 宛 余 保 护 。 当 RAID 中 某 个 磁盘 数据 
失效 的 时 候 ， 可 以 利用 镜像 盘 或 奇偶 校 验 信息 对 该 磁盘 上 的 数据 进行 修复 ， 从 而 提高 了 
数据 的 可 靠 性 "。 


4.2.2 JBOD 及 RAID 级 别 


RAID 技术 将 多 个 小 容量 的 磁盘 组 合成 一 个 大 容量 的 逻辑 磁盘 。 在 RAID 技术 出 现 之 
前 ， 出 现 过 一 种 类 似 于 RAID 的 磁盘 簇 (Just a Bundle 0f Disks，JB0D) 技术 ， 可 以 
理解 为 “仅仅 只 是 一 堆 磁 盘 ”。JB0D 技术 只 是 将 多 个 小 容量 的 磁盘 组 合成 一 个 大 容量 的 
逻辑 磁盘 ， 它 没有 条 带 的 概念 ， 数 据 块 不 能 被 多 个 磁盘 同时 读 写 。 在 JB0D 中 ， 只 有 将 
第 一 块 位 盘 的 存储 空间 使 用 完 ， 才 会 使 用 第 二 块 磁盘 ， 因 此 ，JB0D 可 用 容量 为 所 有 磁 
得 容量 的 总 和 ,但 读 写 性 能 和 单个 的 磁盘 毫 无 差异 。 在 JBOD 的 基础 上 ， 引 入 了 按 条 带 
方式 写 入 数据 的 数据 组 织 方 式 ， 以 镜像 或 奇偶 校 验 为 基础 的 数据 元 余 策 略 ， 就 发 展 成 
了 RAID 技术 。 

根据 不 同 的 元 余 策 略 和 不 同 的 数据 访问 模块 ， 可 以 将 RAID 划分 为 不 同 的 等 级 。 常 
见 的 RAID 级 别 有 RAID 0、RAID 1、RAID 2、RAID 3、RAID 4、RAID 5 以 及 RAID 6。 各 
级 别 的 RAID 既 有 各 目的 优势 ,也 有 不 足 ， 为 了 实现 优势 互补 ， 自 然而 然 地 就 想到 把 多 个 
RAID 等 级 组 合 起 来 ， 以 此 来 获得 具备 更 高 性 能 和 数据 安全 性 的 RAID 组 合 等 级 ， 如 RAID 
00、RAID 01、RAID 10、RAID 100、RAID 30、RAID 50、RAID 53 以 及 RAID 60。 众 多 


数据 存储 技术 


RAID 组 合 等 级 中 ， 能 在 实际 中 得 到 广泛 应 用 的 很 少 ， 本 章 主 要 介绍 RAID 0、RAID 1、 
RAID 5、RAID 6、RAID 01、RAID 10 以 及 RAID 50 这 些 常 用 的 RAID 等 级 。 


4.2.3 RAID 工作 原理 


1. RAID 0 

RAID 0 是 一 种 无 数据 校 验 的 、 简 单 的 并 且 是 所 有 RAID 级 别 中 有 最 高 的 存储 性 能 的 
数据 条 带 化 技术 。RAID 0 从 原理 上 算 不 上 真正 的 RAID， 因 为 它 并 不 支持 数据 匈 余 策略 。 
如 图 4-3 所 示 ，RAID 0 将 所 有 磁盘 条 带 化 后 组 成 大 容量 的 存储 空间 。 





图 4-3 RAID 0 


RAID 0 充分 利用 总 线 带 宽 ， 将 数据 分 散 存 储 在 所 有 磁盘 中 ， 实 现 多 块 物理 磁盘 并 发 / 
并 行 执行 I/0 操作 ， 使 得 访问 性 能 得 到 很 大 的 提升 。 此 外 ， 它 无 数据 元 余 策略 ， 不 需要 
进行 数据 镜像 备份 和 校 验 运算 ， 使 得 RAID 0 成 为 所 有 RAID 等 级 中 性 能 最 好 的 阵列 。 理 
论 上 讲 ， 一 个 由 WVW 块 物理 磁盘 组 成 的 RAID 0 组 ， 它 的 读 写 性 能 是 单 块 物理 磁盘 性 能 的 w 
倍 。 但 受制 于 CPU 处 理 能 力 、 总 线 带宽 、 内 存 大 小 等 因素 ，RAID 0 实际 的 性 能 提升 低 于 
理论 值 。 

RAID 0 具有 低 成 本 、 高 性 能 、100% 空 间 利用 率 等 优点 , 但 是 它 不 提供 数据 见 余 保 护 ， 
只 要 磁盘 组 中 一 块 磁盘 失效 那么 磁盘 数据 就 失效 ， 并 无 法 得 到 恢复 。 此 外 ， 磁 盘 组 中 任 
何 一 个 磁盘 数据 失效 ， 都 可 能 导致 整个 逻辑 磁盘 的 数据 因为 部 分 丢失 而 不 可 用 。 因 此 ， 
RAID 0 一 般 适 用 于 对 性 能 要 求 很 高 但 对 数据 安全 性 要 求 不 高 的 应 用 场景 ， 如 临时 数据 组 
存 、 视 频 / 音 频 存 储 等 。 

以 图 4-4 所 示 的 双 盘 RAID 0 阵列 为 例 ， 当 RAID 0 阵列 照常 工作 时 ， 向 RAID 0 磁 
盘 组 中 的 逻辑 磁盘 发 出 I/0 数据 ， 并 将 I/0 请 求 转化 为 两 项 操作 ， 两 项 操作 并 行 执行 分 
别 落 在 一 块 物理 磁盘 上 。 此 时 ， 原 来 单一 硬盘 顺序 读 写 数据 的 请 求 被 分 散 到 两 块 磁盘 中 
同时 执行 。 从 理论 上 讲 ， 两 块 磁盘 的 并 行 读 写 的 操作 会 将 同一 时 刻 上 磁盘 读 写 速度 提升 


一 倍 。 
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无 数据 宛 余 的 分 条 化 阵列 
图 4-4 ”RAID 0 工作 原理 


写 数 据 时 ，RAID 0 采用 条 带 化 技术 将 数据 写 入 磁盘 组 中 ， 它 将 数据 分 为 数据 块 ， 按 
条 带 写 入 ， 均 匀 地 存储 在 RAID 组 中 的 所 有 磁盘 上 。 只 有 当 RAID 组 的 前 一 个 条 带 被 数据 
块 写 满 后 ， 数 据 才 会 写 入 到 下 一 个 条 带 。 如 图 4-4 所 示 ， 数 据 块 D0、D1、D2、D3、D4、 
D5 将 被 按 条 带 化 方式 依次 写 入 磁盘 组 ， 数 据 块 D0、D1 将 同时 被 号 入 条 带 0 中 ， 分 别 写 
入 磁盘 0 和 磁盘 1 的 相应 条 带 单元 上 ， 数 据 块 D2、D3 将 同时 被 写 入 条 带 1 中 ， 数 据 块 
D4、D5 将 同时 被 写 入 条 带 2 中 ， 依 此 类 推 ， 直 至 组 中 成 员 磁 盘 共 同 完成 一 个 数据 写 入 任 
务 。 由 此 可 知 ， 数 据 写 入 性 能 与 成 员 磁盘 的 数量 成 正比 。 

读数 据 时 ，RAID 0 接收 到 数据 读 取 请 求 ， 它 会 在 所 有 磁盘 上 搜索 并 读 取 目 标 数据 块 ， 
经 过 整合 后 将 数据 返回 给 主机 。 如 图 4-4 所 示 ， 假 设 阵 列 收 到 读 取 数据 块 D0、D1、D2、 
D3、D4、D5 的 请 求 ， 数 据 块 D0、D1 将 从 条 带 0 中 同时 被 读 取 ， 数 据 块 0D2、D3 将 从 条 带 
1 中 同时 被 读 取 ， 数 据 块 D4、D5 也 将 从 条 带 2 中 同时 被 读 取 ， 依 此 类 推 ， 当 所 有 的 数据 
块 从 磁盘 被 读 取 后 ， 经 RAID 控制 器 整合 后 发 送 给 主机 。 和 数据 的 写 入 同 理 ，RAID 0 的 
读 取 性 能 与 组 中 成 员 磁 盘 的 数量 成 正比 。 

上 面 介 绍 了 RAID 0 在 正常 《所 有 磁盘 都 正常 ) 情况 下 的 工作 情况 ， 当 某 磁 盘 发 生 
失效 时 ，RAID 0 将 无 法 正常 执行 读 写 操作 。 如 图 4-5 所 示 ， 三 个 磁盘 组 成 了 一 个 RAID 0 
组 ， 如 果 阵 列 中 的 某 一 磁盘 (如 磁盘 1) 出 现 故 障 ， 整 个 磁盘 组 则 会 失效 。 假 设 一 个 文 
件 被 存储 到 这 个 RAID 0 磁盘 组 上 ， 此 文件 的 数据 将 被 分 成 若干 数据 块 ， 即 数据 块 D0、 
D1、D2、D3、D4、D5、D6、D7、D8， 并 分 散 存 储 在 组 中 三 块 磁盘 上 。 磁 盘 1 失效 将 导致 
数据 块 D1、D4、D7 丢失 ,尽管 磁盘 0 和 磁盘 2 仍然 存 有 该 文件 的 部 分 数据 块 ， 但 整个 文 
件 的 数据 已 经 不 完整 ， 而 文件 系统 将 无 法 访问 此 类 不 完整 的 文件 。 简 而 言 之 ，RAID 0 只 
是 提供 了 一 种 数据 组 织 方式 ， 但 不 提供 数据 保护 。 
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2. RAID 1 

RAID 1 又 称 为 镜像 (Mirroring)， 是 具有 全 元 余 的 阵列 模式 。RAID 1 包括 一 个 数 
据 磁 盘 〈 数 据 盘 )， 一 个 或 者 多 个 备用 磁盘 〈 镜 像 盘 )。 每 次 写 数 据 时 ， 数 据 盘 上 的 数据 
将 完全 地 备份 到 镜像 盘 中 。 当 数据 盘 失 效 时 ， 镜 像 盘 会 接管 数据 盘 的 业务 ， 保 证 业务 的 
连续 性 。 

如 图 4-6 所 示 ， 使 用 两 个 完全 相同 的 磁盘 可 组 成 一 个 最 简单 的 RAID 1 阵列 。 


RAID 1 








Wi 
I- 
ll: 羽 


图 4-6 RAID 1 

镜像 盘 作 为 备份 ， 可 显著 提高 数据 的 可 用 性 。 由 于 RAID 1 阵列 中 一 个 磁盘 保存 数 
据 ， 另 一 磁盘 保存 的 是 数据 的 副本 ， 因 此 RAID 1 的 空间 利用 率 是 50%。 例 如 ， 将 1GB 数 
据 写 入 阵列 中 ， 需 要 占用 2GB 的 存储 空间 。RAID 1 的 两 个 磁盘 通常 是 容量 相等 的 ， 若 两 
个 磁盘 的 容量 大 小 不 同 ， 可 用 容量 是 两 个 磁盘 中 容量 较 小 的 磁盘 的 容量 。 

RAID 0 采用 条 带 化 技术 将 不 同 数据 并 行 写 入 到 磁盘 中 ， 而 RAID 1 则 是 采用 条 带 化 
技术 将 相同 的 数据 并 行 写 入 到 磁盘 中 。RAID 1 读 取 数据 的 时 候 ， 会 同时 读 取 数据 盘 和 镜 
像 盘 上 的 数据 ， 以 提高 读 取 性 能 。 如 果 在 其 中 一 个 磁盘 中 读 操 作 执行 失败 ， 则 可 以 从 另 
一 个 磁盘 读 取 数据 。 

假设 磁盘 0 和 磁盘 1 组 成 一 个 RAID 1， 磁 盘 0 作为 数据 盘 ， 磁 盘 1 作为 镜像 盘 ， 则 





第 4 章 传统 磁盘 驱动 器 的 读 写 技术 


数据 块 D0、D1 和 D2 为 需要 读 写 的 数据 ， 如 图 4-7 所 示 。 





等 效 罗 辑 磁 盘 镜像 宛 余 阵列 
图 4-7 RAID 1 工作 原理 


写 数 据 时 ，RAID 1 以 双 写 的 方式 将 数据 写 入 两 个 磁盘 中 。 以 图 4-7 中 数据 块 D0、 
D1 和 D2 写 入 磁盘 组 过 程 为 例 : 首先 , 数据 块 D0 及 其 副本 同时 被 写 入 磁盘 0 和 磁盘 1 中 ， 
而 后 数据 块 D1 及 其 副本 也 同时 被 写 入 磁盘 0 和 磁盘 1 中 , 依 此 类 推 , 直至 所 有 数据 块 均 
以 同样 的 方式 写 入 到 RAID 1 磁盘 组 中 。 在 RAID 1 中 ， 因 为 数据 需要 被 写 入 数据 盘 和 镜 
像 盘 ， 因 此 写 性 能 会 稍 受 影响 。 

读数 据 时 ，RAID 1 会 同时 读 取 数据 盘 和 镜像 盘 上 的 数据 。 假 设 阵列 收 到 读 取 数据 块 
D0、D1 和 D2 的 请 求 ， 则 数据 块 D0 和 D1 可 以 分 别 由 磁盘 0 和 磁盘 1 同时 读 出 (其 他 数 
据 块 同 理 )， 直 至 所 有 数据 被 读 取出 并 经 控制 器 整合 后 返回 给 主机 。 因此， 正常 工作 状态 
下 RAID 1 系统 的 读 性 能 等 于 两 个 磁盘 的 读 性 能 之 和 。 需 要 特别 注意 的 是 ， 当 RAID 1 磁 
得 组 在 正常 工作 时 ， 成 员 盘 发 生 故障 或 掉 线 ， 会 由 工作 状态 进入 降级 状态 。 假 设 图 4-7 
中 磁盘 0 发 生 故 障 ，RAID 1 磁盘 组 进入 降级 状态 ， 此 时 只 能 从 磁盘 1 中 读 取 数据 ， 因 此 ， 
相 比 工作 状态 ， 降 级 状态 下 读 性 能 会 下 降 一 半 。 

RAID 1 的 数据 盘 与 镜像 盘 具 有 相同 的 内 容 。 当 数据 盘 出 现 故障 时 ， 可 以 使 用 镜像 盘 
恢复 数据 。 如 图 4-8 所 示 ， 假 设 磁盘 0 为 数据 盘 ， 磁 盘 1 为 镜像 盘 ， 当 磁盘 0 出 现 数据 
失效 时 ， 可 以 用 一 个 新 磁盘 或 热 备 盘 蔡 换 磁盘 0， 并 从 磁盘 1 中 将 数据 复制 到 新 磁盘 或 
热 备 盘 里 ， 以 恢复 丢失 的 数据 。 当 RAID 1 组 中 有 磁盘 失效 时 ， 只 要 新 磁盘 数据 没有 完成 
重建 ，RAID 1 就 处 于 降级 状态 ， 而 当 单 个 磁盘 的 容量 越 高 ， 需 要 恢复 的 数据 就 越 多 ， 数 
据 重 建 时 间 就 会 越 长 。 
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D0、D1、D2 





国 i 
数据 盘 故 障 镜像 盘 正 党 
图 4-8 RAID 1 的 数据 恢复 
3. RAID 3 和 RAID 4 
RAID 3 和 RAID 4 都 采用 一 个 专用 的 磁盘 用 于 存放 校 验 数 据 ， 即 校 验 盘 。 下 面 主要 
描述 RAID 3 技术 。RAID 3 可 以 被 认为 是 RAID 0 的 一 种 改进 模式 。 相 比 RAID 0，RAID 3 
增加 了 一 个 专用 的 磁盘 作为 校 验 盘 〈 见 图 4-9 中 的 磁盘 3)。 





图 4-9 RAID 3 


RAID 3 至 少 需要 三 块 磁盘 ， 它 将 不 同 磁盘 上 同一 条 带 上 的 数据 利用 异 或 算法 作为 奇 
偶 校 验 ， 所 得 校 验 数据 写 入 校 验 盘 中 对 应 条 带 的 条 带 单 元 上 。RAID 3 支持 从 多 个 磁盘 并 
行 读 取 数 据 ， 读 性 能 非常 高 。 而 写 入 数据 时 ， 必 须 计 算 对 应 条 带 数据 的 校 验 数 据 ， 并 将 
校 验 数据 写 入 校 验 盘 中 ， 一 次 写 操作 包含 了 写 数据 块 、 读 取 同 条 带 的 其 他 数据 块 、 计 算 
校 验 数据 、 写 入 校 验 数据 多 个 操作 ， 写 操作 开销 大 ， 写 操作 性 能 相对 较 低 。 当 RAID 3 
中 某 一 磁盘 出 现 故 障 时 ， 不 会 影响 数据 读 取 ， 可 以 借助 校 验 数据 和 其 他 完好 数据 来 重建 
失效 数据 。 如 果 所 要 读 取 的 数据 块 正好 位 于 失效 磁盘 ， 系 统 则 需 读 取 与 该 数据 块 位 于 同 
一 条 带 的 其 他 数据 块 和 校 验 数据 块 ,根据 奇偶 校 验 逆 运算 重建 丢失 的 数据 并 发 送 给 主机 ， 
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从 而 对 读 性 能 有 一 定 影 响 。 当 故障 磁盘 被 更 换 后 ， 系 统 按 相同 的 方式 重建 故障 盘 中 的 数 
据 ， 并 写 到 新 磁盘 。 

RAID 3 采用 单 盘 容错 并 行 传输 工作 方式 ， 即 采用 条 带 技术 将 数据 分 块 ， 并 对 这 些 数 
据 块 进行 异 或 校 验 ， 最 终 将 所 得 校 验 数据 写 到 校 验 盘 上 。 当 一 个 磁盘 发 生 故 障 ， 除 故障 
盘 外 ， 还 可 以 继续 对 数据 盘 和 校 验 盘 进行 读 写 操作 。 如 图 4-10 所 示 ， 假 设 RAID 3 由 4 
块 盘 组 成 ,磁盘 0、 磁 盘 1 和 磁盘 2 作为 数据 盘 ， 磁 盘 3 作为 校 验 盘 ，A、B、C 为 需要 读 
写 的 数据 。 





图 4-10 RAID 3 工作 原理 


写 数 据 时 ，RAID 3 采用 并 行 方 式 写 入 数据 。 假 设 数 据 A、B、C 将 依次 被 写 入 磁盘 组 
中 ， 整 个 过 程 如 下 : 首先 ， 收 到 写 请 求 之 后 ， 控 制 器 对 数据 进行 分 块 ， 数 据 A 被 分 拆 成 
数据 块 A0、Al1、A2， 将 这 三 个 数据 块 进行 异 或 运算 得 到 校 验 数据 块 P1: 将 数据 块 A0、 
Al、A2、P1 同时 写 入 同一 条 带 上 〔 分 别 落 于 磁盘 0、 人 磁盘 1、 磁盘 2、 磁 盘 3 的 相应 条 带 
单元 上 )。 同 理 ， 数 据 B 和 C 以 同样 的 方式 被 写 入 磁盘 组 中 。RAID 3 组 中 成 员 盘 共同 完 
成 一 个 数据 写 入 任务 ， 理 论 上 数据 写 入 性 能 与 数据 盘 的 数量 成 正比 。 

读数 据 时 ， 其 和 写 数 据 过 程 类 似 ，RAID 3 采用 并 行 方 式 读 取 数 据 。 假 如 阵列 收 到 读 
取 数 据 A、B、C 的 请 求 ， 数 据 块 A0、Al、A2 将 从 对 应 条 带 单元 中 同时 被 读 取 ， 经 RAID 
控制 器 整合 后 发 送 给 主机 。 数 据 B 和 C 以 同样 的 方式 被 读 取 ， 理 论 上 RAID 3 的 读 性 能 与 
数据 盘 的 数量 成 正比 。 

在 正常 工作 状态 下 ，RAID 3 数据 读 取 时 没有 用 到 校 验 盘 ， 数 据 盘 支持 对 读 请 求 的 并 
发 /并 行 响应 ， 读 性 能 非常 高 。 而 在 写 数据 时 ，RAID 3 会 把 数据 的 写 入 操作 分 散 到 多 个 
磁盘 上 进行 ， 然 而 不 管 是 向 哪 一 个 数据 盘 写 入 数据 ， 都 需要 同时 重 写 校 验 盘 中 的 相关 信 
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息 。 因 此 ， 对 于 那些 经 常 需要 执行 大 量 写 入 操作 的 随机 业务 来 说 ， 校 验 盘 的 负载 将 会 很 
大 ， 而 且 校 验 盘 在 同一 时 刻 只 能 响应 一 个 写 操作 ， 这 将 导致 RAID 3 不 能 支持 对 多 个 写 请 
求 的 并 发 响应 ， 此 时 整个 系统 写 操作 性 能 较 低 。 而 对 于 数据 连续 的 顺序 业务 而 言 ， 数 据 
块 一 般 能 满 条 带 写 入 ， 每 写 一 个 条 带 计算 一 块 校 验 数据 即 可 。 因 此 RAID 3 可 以 支持 一 个 
写 请 求 的 并 行 响应 ， 此 时 整个 系统 的 写 操作 性 能 相对 较 高 。 

当 RAID 3 磁盘 组 中 某 一 块 磁盘 发 生 故障 时 ，RAID 3 通过 对 剩余 数据 盘 上 的 数据 块 
和 校 验 盘 上 的 校 验 数据 做 异 或 计算 ， 重 构 出 故障 盘 上 原 有 的 数据 。 以 图 4-11 所 示 的 
RAID 3 为 例 ， 当 磁盘 0 出 现 故 障 时 ， 其 存储 的 数据 块 A0、B0、C0 丢失 ， 故 障 盘 失 效 恢 
复 需要 经 历 如 下 过 程 : 将 与 数据 块 A0 同一 条 带 上 数据 块 A1、A2 和 校 验 块 Pl 从 各 自 磁 
盘 中 取出 ， 进 行 异 或 运算 得 到 数据 块 A0， 从 而 恢复 出 数据 块 A0; 同 理 ， 还 可 以 恢复 出 
数据 块 B0 和 C0。 如 此 循环 ， 直 至 恢复 出 磁盘 0 上 的 所 有 数据 。 


A0、 Al、 A2、 BO0、 Bl、 B2、 C0, Cl. CQ2、 
和 





加 -加 痢 


磁盘 故障 “通过 反 校 验 恢复 数据 
图 4-11 RAID 3 磁盘 故障 及 数据 失效 





4. RAID 5 ， 

RAID 5 是 目前 最 常用 的 RAID 等 级 ， 通 过 条 带 化 形式 将 数据 写 入 磁盘 组 中 。 与 RAID 
3 类 似 ，RAID 5 每 个 条 带 上 都 有 一 份 校 验 数据 ， 不 同 之 处 在 于 RAID 5 不 同 条 带 上 的 校 验 
数据 不 是 单独 存在 一 个 固定 的 校 验 盘 里 的 ， 而 是 按 一 定 规律 分 散 存放 在 阵列 的 各 个 磁盘 
里 ， 如 图 4-12 所 示 。 

阵列 中 每 个 磁盘 都 存储 有 数据 块 和 校 验 数据 ， 当 数据 块 按 条 带 方式 写 入 时 ， 校 验 数 
据 也 同时 被 写 入 该 条 带 的 某 个 磁盘 的 条 带 单元 里 。 因 此 ，RAID 5 不 存在 RAID 3 中 并 发 
写 操作 时 校 验 盘 性 能 瓶颈 问题 。 另 外 ，RAID 5 还 具备 很 好 的 扩展 性 ， 当 阵列 磁盘 数量 增 
加 时 ， 并 行 操 作 能 力也 随 之 增强 ， 从 而 拥有 更 大 的 容量 以 及 更 高 的 性 能 。 

RAID 5 的 磁盘 上 同时 存储 数据 和 校 验 数据 ， 同 条 带 的 数据 块 和 对 应 的 校 验 信 息 保 存 
在 不 同 的 磁盘 上 。 当 一 个 数据 盘 损 坏 时 ， 系 统 可 以 根据 同一 条 带 的 其 他 数据 块 和 校 验 数 
据 来 重建 失效 的 数据 。 处 于 降级 状态 进行 数据 重 构 时 ，RAID 5 的 用 户 访问 性 能 会 受到 较 
大 的 影响 。RAID 5 兼顾 存储 性 能 、 数 据 安全 和 存储 成 本 等 各 方面 因素 ， 基 本 上 可 以 满足 
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大 部 分 的 存储 应 用 需求 ， 因 此 ， 数 据 中 心 大 多 情况 下 采用 它 作 为 应 用 数据 的 保护 方案 。 









号 :于 
图 4-12 RAID 5 数据 分 布 
RAID 5 使 用 的 是 分 布 式 奇偶 校 验 ， 每 个 成 员 盘 都 存放 用 户 数据 和 校 验 数据 。 由 于 没 
有 用 专门 的 校 验 盘 来 保存 校 验 数据 ，RAID 5 不 存在 校 验 盘 性 能 瓶颈 或 热点 问题 。 假 设 一 
个 RAID 5 的 磁盘 数 为 WW 则 其 中 有 效用 户 数据 存储 容量 数 为 Al。 在 RAID 3 和 RAID 5 
的 磁盘 阵列 中 ， 如 果 一 个 磁盘 失效 ， 则 该 磁盘 组 将 从 正常 工作 《在线 ) 状态 转变 为 降级 
状态 ， 并 在 降级 状态 下 完成 丢失 数据 的 重 构 。 如 果 重 构 过 程 中 另 一 个 磁盘 也 出 现 故 障 ， 
则 磁盘 组 的 数据 将 会 永久 丢失 。 
下 面 以 一 个 简单 例子 来 说 明 RAID 5 的 读 写 过 程 。 如 图 4-13 所 示 ， 人 磁盘 0、 磁盘 1、 
磁盘 2 组 成 了 一 个 RAID 5， 数 据 块 D0O、D1、D2、D3、D4、D5 是 需要 存 取 的 数据 。 





等 效 罗 辑 磁 盘 
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分 布 式 奇 侦 校 验 码 的 独立 磁盘 结构 
图 4-13 RAID 5 的 工作 原理 


) 
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写 数据 时 ，RAID 5 按 条 带 进行 。 各 个 磁盘 上 既 存 储 数据 块 ， 又 存储 校 验 数据 。 假 设 
数据 块 D0、D1、D2、D3、D4、D5 将 依次 被 写 入 磁盘 组 ， 写 入 过 程 如 下 : 首先 ， 利 用 数据 
D0、D1 进行 异 或 运算 得 到 校 验 数据 P0; 而 后 将 数据 块 D0、D1、P0 按 条 带 化 方式 同时 写 
入 ， 分 别 落 于 磁盘 0、 磁 盘 1 和 磁盘 2 的 相应 条 带 单元 上 。 以 同样 的 方式 , 将 数据 块 D2、 
D3、D4、D5 及 其 校 验 数据 P1、P2 写 入 磁盘 中 ， 由 于 采用 分 布 式 校 验 数 据 布 局 ， 校 验 数 
据 PO、P1、P2 分 别 落 在 磁盘 2、 磁 盘 1、 磁盘 0 中 。 

读数 据 时 ，RAID 5 只 读 取 磁 盘 中 的 用 户 数据 块 ， 而 不 需 读 取 校 验 数据 。 假 设 阵 列 收 
到 读 取 数 据 块 D0、D1、D2、D3、D4、D5 的 请 求 ， 数 据 块 D0、D1 将 同时 从 磁盘 0 和 磁盘 
1 中 被 读 取 ， 随 后 ， 数 据 块 D2、D3 将 同时 从 磁盘 0 和 磁盘 2 中 被 读 取 ， 数 据 块 D4、D5 
也 将 同时 从 磁盘 1 和 磁盘 2 中 被 读 取 , 所 有 的 数据 块 从 磁盘 被 读 取 后 , 经 RAID 控制 器 整 
合 后 发 送 给 主机 。 

在 RAID 5 中 ， 如 果 有 一 块 磁盘 失效 ， 可 对 其 他 成 员 磁 盘 进 行 异 或 运算 ， 恢 复出 故 
障 磁盘 上 的 数据 。 如 图 4-14 所 示 ， 磁 盘 0 数据 失效 ， 该 磁盘 上 数据 块 00、D2 和 校 验 数 
据 P2 丢失 。 首 先 恢复 数据 块 D0, 将 与 数据 块 D0 同一 条 带 上 数据 块 DI1 和 P0 从 各 自 磁盘 
中 读 取出 ， 进 行 异 或 运算 得 到 数据 D0; 再 用 相同 方法 恢复 出 数据 块 D2 和 P2， 直 至 将 磁 
盘 0 上 的 数据 全 部 恢复 。 





等 效 逻 辑 陪 盘 


图 4-14 ”RAID 5 数据 失效 


5. RAID 6 

前 面 所 述 的 RAID 1、RAID 3 和 RAID 5 都 只 能 保护 因 单个 磁盘 失效 而 造成 的 数据 委 
失 ， 如 果 两 个 磁盘 同时 发 生 故障 ， 数 据 将 无 法 恢复 。RAID 6 引入 双重 校 验 的 概念 ， 常 用 
的 校 验方 式 有 两 种 : 一 种 是 P+Q 校 验 ; 另 一 种 是 DP 校 验 双 ) 。 

RAID 6 是 在 RAID 5 和 RAID 3 的 基础 上 为 了 进一步 增强 数据 保护 而 设计 的 一 种 RAID， 
可 以 看 作 是 RAID 5 和 RAID 3 的 一 种 扩展 。 当 阵列 中 同时 出 现 两 个 磁盘 失效 时 ， 阵 列 仍 
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能 够 继续 工作 ， 丢 失 数 据 依然 可 以 得 到 恢复 。RAID 6 不 仅 要 支持 数据 块 的 恢复 ， 还 要 支 
持 校 验 数 据 的 恢复 ， 因 此 实现 代价 很 高 ， 控 制 器 的 设计 也 比 其 他 等 级 更 复杂 、 更 昂贵 。 
RAID 6 的 工作 原理 是 磁盘 组 中 每 个 条 带 上 有 两 份 校 验 数 据 ， 如 图 4-15 所 示 。 





图 4 15 RAID 6 


当 RAID 6 采用 P+Q 校 验 时 ，P 和 Q 代 表 2 个 彼此 独立 的 校 验 数据 ， 可 以 使 用 不 同 的 
校 验 方式 计算 得 到 ,用 户 数据 和 校 验 数据 分 布 在 同一 条 带 的 所 有 磁盘 上 ,如 图 4-16 所 示 。 





图 4-16 RAID 6 工作 原理 (P+Q) 


P 通过 用 户 数据 块 的 简单 的 异 或 运算 得 到 ，Q 是 对 用 户 数据 进行 GE〈 伽 罗 瓦 域 ) 变 
换 再 异 或 运算 得 到 。a、B 和 ?为 常量 系统 ， 由 此 产生 的 值 是 一 个 所 谓 的 “芦苇 码 ” 该 算 
法 将 数据 磁盘 相同 条 带 上 的 所 有 数据 进行 转换 和 异 或 运算 。 以 校 验 数 据 PO 和 Q0 为 例 ， 
下 列 公式 是 P 了 和 Q 的 计算 方法 : 


PO=DO®D1@®D2 
Q0=(axD0) ® (BxD1) ® (yxD2) 

RAID 6 阵列 中 只 有 一 个 磁盘 数据 失效 时 ， 利 用 P 校 验 数 据 即 可 恢复 失效 磁盘 上 的 数 

据 ， 恢 复 过 程 与 RAID 5 类 似 。 当 两 个 磁盘 同时 失效 时 ， 则 根据 不 同 的 场景 有 不 同 的 处 理 
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方法 。 假 设 图 4-16 中 的 磁盘 0 和 磁盘 1 数据 失效 ， 即 PO、Q0、D3、P1、D6、D7、D9、 
D10、Q4、Q12 数据 丢失 ，P0 和 Q0 可 以 通过 对 条 带 0 中 数据 块 D0、D1、D2 进行 P 和 Q 
校 验 运算 ， 恢 复出 PO 和 Q0; 其 他 丢失 数据 同样 可 以 将 对 应 条 带 上 未 丢失 的 数据 读 取 出 。 
利用 以 上 两 个 校 验 公式 ， 组 成 方程 组 进行 求解 ， 实 现 数据 的 恢复 。 

除了 P+Q 校 验 生产 方式 ，DP (Double Parity) 校 验 也 比较 普及 。DP 校 验 盘 是 在 RAID 
3 基础 上 增加 的 一 个 和 斜 向 校 验 盘 ， 用 于 存放 和 斜 向 的 校 验 数据 ， 如 图 4-17 所 示 。 


Er 


一 一 一 一 呈 
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数据 盘 0 数据 盘 1 


数据 盘 2 数据 盘 3 P 校 验 盘 DP 校 验 盘 
图 4-17 RAID 6 工作 原理 (DP) 


DP 横向 校 验方 式 与 RAID 3 中 的 校 验方 式 完 全 相同 ， 为 各 个 数据 盘 中 对 应 条 带 数 据 
块 生产 校 验 数据 P0、P1、P2 和 P3， 和 斜 向 校 验 盘 中 校 验 数据 DP0、DP1、DP2 和 DP3 为 各 个 
数据 盘 及 横向 校 验 盘 的 斜 向 数据 校 验 信息 。 相关 公式 如 下 (以 PO 和 DP0 为 例 , 其 他 同 理 )。 

P0=D0@D1@9D2@D3 
DP0=D0@D5@D10@D15 

6. RAID 01 和 RAID 10 

RAID 01 是 先 做 条 带 化 再 做 镜像 ， 实 质 是 对 条 带 化 后 的 虚拟 磁盘 实现 镜像 。RAID 01 
结构 其 实 非常 简单 ， 如 图 4-18 所 示 , RAID 组 包括 两 个 RAID 0 子 组 ( 即 子 组 内 做 RAID 0， 
子 组 间 做 RAID 1)。 





图 4-18 RAID 01 
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首先 利用 4 块 磁盘 创建 两 个 独立 的 RAID 0 子 组 ， 然 后 将 这 两 个 RAID 0 子 组 成 一 个 
RAID 1， 从 而 ， 这 4 个 磁盘 构成 了 RAID 01 组 。 数 据 被 写 入 RAID 01 时 将 同时 被 写 入 到 
两 个 磁盘 阵列 中 ， 其 中 一 个 RAID 0 子 组 数据 失效 时 ， 整 个 阵列 仍 可 继续 工作 ， 保 证 数据 
安全 性 的 同时 又 提高 了 性 能 ， 但 整体 磁盘 利用 率 仅 为 50%。 

与 RAID 01 不 同 ，RAID 10 是 先 做 镜像 再 做 条 带 化 ， 实 质 是 对 镜像 后 的 虚拟 磁盘 实 
现 条 带 化 。 如 图 4-19 所 示 ，RAID 10 组 包括 两 个 RAID 1 子 组 ( 即 子 组 内 做 RAID 1， 子 
组 间 做 RAID 0)。 





图 4-19 RAID 10 


首先 利用 4 块 磁盘 创建 两 个 独立 的 RAID 1 子 组 ， 然 后 将 这 两 个 RAID 1 子 组 成 一 个 
RAID 0， 即 这 4 个 磁盘 构 了 一 个 RAID 10。RAID 10 兼 具 RAID 0 和 RAID 1 两 者 的 特性 ， 
虽然 造成 了 50% 的 磁盘 浪费 ， 但 它 不 仅 提供 了 200% 的 速度 ， 而 且 提高 了 数据 安全 性 。 一 
个 RAID 1 子 组 内 最 多 允许 坏 一 个 磁盘 ， 如 果 不 在 同一 个 RAID 1 子 组 中 的 两 个 磁盘 同时 
损坏 ， 也 不 会 导致 数据 丢失 ， 整 个 RAID 10 组 仍 能 正常 工作 。 

总 的 来 说 ，RAID 10 和 RAID 01 均 以 RAID 0 为 执行 阵列 ， 以 RAID 1 为 数据 保护 阵 
列 ， 具 有 与 RAID 1 一 样 的 容错 能 力 ， 用 于 容错 处 理 的 系统 开销 与 RAID 1 基本 一 样 。 由 
于 使 用 RAID 0 作为 执行 阵列 ， 具 有 较 高 的 1/0 宽带 ，RAID 10 适用 于 数据 库存 储 服务 器 
等 需要 高 性 能 、 高 容错 性 但 对 磁盘 利用 率 要 求 不 高 的 场合 ,下面 以 RAID 10 为 例 描述 RAID 
10 的 工作 原理 CRAID 01 与 RAID 10 类 似 ， 不 再 歼 述 )。 

在 图 4-20 所 示 的 RAID 10 中 ， 物 理 磁盘 0 和 磁盘 1 构成 一 个 RAID 1 子 组 ， 物 理 磁 
得 2 和 物理 磁盘 3 形成 男 一 个 RAID 1 子 组 ， 这 两 个 RAID 1 子 组 再 做 RAID 0 形成 了 一 个 
RAID 10 组 。 

系统 RAID 10 发 出 1/0 数据 请 求 被 转化 为 两 项 操作 ， 每 一 项 操作 对 应 一 个 RAID 1 
磁盘 子 组 ， 原 来 顺序 的 数据 请 求 被 分 散 到 两 个 RAID 1 子 组 中 同时 执行 ， 每 个 RAID 1 子 
组 将 对 对 应 数据 实施 镜像 操作 , 即 磁 盘 0 和 磁盘 1 互 做 镜像 , 磁盘 2 和 磁盘 3 互 做 镜像 。 


数据 存储 技术 








图 4-20 RAID 10 工作 原理 


写 数 据 时 ，RAID 10 采用 条 带 化 技术 将 数据 写 入 RAID 1 子 组 中 ， 它 将 数据 分 为 数据 
块 ， 并 均匀 地 分 散 存储 在 所 有 RAID 1 子 组 中 。 如 图 4-20 所 示 ， 数 据 块 D0、D1、D2、D3、 
D4、D5 将 被 依次 写 入 两 个 磁盘 子 组 中 ， 并 在 组 内 做 镜像 ， 数 据 块 D0、D1 将 同时 被 写 入 
一 个 条 带 中 ， 分 别 落 于 两 个 RAID 1 子 组 中 ， 最 终 数据 块 D0 将 以 镜像 的 方式 存储 在 磁盘 
0 和 磁盘 1 中 ， 而 数据 块 D1 也 将 以 镜像 的 方式 存储 在 磁盘 2 和 磁盘 3 中 …… 依 此 类 推 ， 
数据 块 D2、D3、D4、D5 将 以 同样 的 方式 被 写 入 到 阵列 中 。 通 过 条 带 化 并 行 的 方式 ， 最 终 
将 所 有 数据 块 写 入 阵列 中 ， 其 写 入 性 能 与 RAID 1 子 组 的 数量 成 正比 。 

读数 据 时 ， 当 RAID 10 接收 数据 读 取 请 求 时 ， 它 会 在 所 有 磁盘 上 搜索 目标 数据 块 并 
读 取 数据 。 如 图 4-20 所 示 ， 首 先 ，RAID 10 收 到 读 取 数据 块 D0、D1、D2、D3、D4、D5 
的 请 求 ， 阵 列 可 以 同时 从 磁盘 0、 磁 盘 1、 磁 盘 2 和 磁盘 3 中 分 别 读 取 数据 块 D0、D2、 
D1、D3， 数 据 块 D4、D5 也 按 类 拟 的 方式 被 读 取出 来 。 当 所 有 的 数据 块 从 阵列 中 被 并 行 读 
取 后 ， 集 合 到 RAID 控制 器 中 ， 经 控制 器 整合 后 发 送 到 主机 。RAID 10 的 并 发 读 取 性 能 与 
磁盘 的 数量 成 正比 。 

当 不 同 的 RAID !1 子 组 的 磁盘 出 现 故障 时 ，RAID 10 整体 上 数据 访问 不 受 影响 。 如 图 
4-20 中 ，RAID 10 中 的 磁盘 1 和 磁盘 3 出 现 故 障 ， 由 于 磁盘 0 和 磁盘 2 分 别 有 磁 盘 1 和 
磁盘 3 的 完整 数据 副本 , 所 以 两 个 故障 盘 上 数据 是 可 以 恢复 的 ,但 是 , 如 果 位 于 同一 RAID 
1 子 组 中 的 两 个 磁盘 同一 时 间 发 生 故 障 , 例如 磁盘 0 和 磁盘 1， 数 据 将 不 能 被 访问 。 从 理 
论 上 讲 ，RAID 10 可 以 忍受 总 数 一 半 的 物理 磁盘 失效 ， 然 而 ， 从 以 上 分 析 来 看 ， 在 同一 
个 子 组 出 现 两 个 失效 磁盘 时 ，RAID 10 也 可 能 出 现 数据 丢失 ， 所 以 RAID 10 通常 用 于 防 
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止 单一 磁盘 失效 的 应 用 场景 。 

7. RAID 50 

RAID 50 是 RAID 5 与 RAID 0 的 结合 ， 即 组 内 做 RAID 5， 构 成 RAID 5 子 组 ， 组 间 
做 RAID 0。 由 于 每 个 RAID 5 子 组 要 求 最 少 有 三 个 磁盘 ， 所 以 RAID 50 中 要 求 最 少 有 6 
块 盘 。 相 比 RAID 5 而 言 ，RAID 50 具备 更 高 的 容错 能 力 ， 其 同时 允许 各 个 RAID 5 子 组 
各 坏 一 个 磁盘 ， 即 ， 既 允许 某 个 RAID 5 子 组 内 有 一 个 磁盘 数据 失效 ， 也 允许 两 个 RAID 5 
子 组 中 各 坏 一 个 磁盘 。 由 于 检验 数据 分 布 于 在 两 个 RAID 5 子 组 上 ，, 重 构 速度 相 比 于 单独 
的 RAID 5 有 很 大 提高 ;此 外 ，RAID 50 读 写 性 能 也 相当 好 。 

RAID 50 兼 具 RAID 5 和 RAID 0 的 特性 。 它 通常 由 两 组 RAID 5 子 磁盘 组 成 (如 
图 4-21 所 示 )， 每 一 子 组 都 使 用 了 分 布 式 奇偶 检验 ， 而 两 个 子 组 磁盘 再 组 建成 RAID 0， 
实现 跨 人 磁盘 抽 取 数 据 。RAID 50 提供 可 靠 的 数据 存储 和 良好 的 访问 性 能 。 即 使 两 个 位 于 
不 同 子 组 的 物理 磁盘 发 生 故障 ， 数 据 也 可 以 顺利 实现 恢复 。 





D0、D1、D4、D5、D8、D9 


图 4-21 RAID 50 工作 原理 


4.2.4 ”RAID 对 比 和 应 用 


RAID 0 的 优点 在 于 读 写 性 能 好 ， 存 储 数据 被 分 割 成 W (成 员 盘 数 ) 部 分 ， 分 别 存储 
在 W 个 磁盘 上 ， 理 论 上 逻辑 磁盘 的 读 写 性 能 是 单 块 磁盘 的 W 倍 ， 实 际 容量 等 于 阵列 中 最 
小 磁盘 容量 的 W 倍 。RAID 0 的 缺点 在 于 安全 性 低 ， 任 何 一 块 磁盘 发 生 故 障 ， 数 据 都 无 法 
恢复 ， 甚 至 可 能 导致 整个 RAID 上 的 数据 丢失 。RAID 0 比较 适合 于 读 写 性 能 要 求 高 但 安 
全 性 要 求 不 高 的 应 用 ， 如 存储 高 清 电影 、 图 形 工 作 站 等 。 
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RAID 1 模式 的 优点 在 于 安全 性 很 高 ， 信 1 个 磁盘 作为 镜像 盘 ， 允 许 入 1 个 磁盘 故障 ， 
当 一 个 磁盘 受 损 时 ， 换 上 一 个 新 磁盘 替代 原 磁盘 即 可 自动 恢复 数据 和 继续 使 用 。RAID 1 
的 缺点 在 于 磁盘 读 写 性 能 一 般 且 空间 利用 率 低 ， 存 储 速度 与 单 块 磁盘 相同 ， 阵 列 实际 容 
量 等 于 WV 个 磁盘 中 最 小 磁盘 的 容量 。 RAID 1 比较 适用 于 安全 性 要 求 高 的 应 用 , 如 服务 器 、 
数据 库存 储 等 。 

RAID 3 的 优点 在 于 读 性 能 非常 好 且 安 全 性 较 高 ， 和 RAID 0 一 样 从 多 个 磁盘 条 带 并 
行 读 取 数 据 ，W 块 盘 的 RAID 3 读 性 能 与 入 1 块 盘 的 RAID 0 的 不 相 上 下 ， 由 于 RAID 3 有 
校 验 数据 ， 当 W 个 磁盘 中 的 其 中 一 个 磁盘 出 现 故 障 时 ， 可 以 根据 其 他 MI 个 磁盘 中 的 数 
据 恢 复出 故障 盘 上 的 数据 ; 缺点 在 于 写 性 能 不 好 ，RAID 3 支持 顺序 业务 的 并 行 写 操作 ， 
却 不 支持 随机 业务 的 并 发 写 操作 ， 因 为 校 验 数 据 统一 存放 在 检验 盘 上 ， 写 性 能 受到 校 验 
盘 的 限制 。RAID 3 比较 适用 于 连续 数据 写 、 安 全 性 要 求 高 的 应 用 ， 如 视频 编辑 、 大 型 数 
据 库 等 。 

RAID 5 的 优点 在 于 存储 性 能 较 好 、 数 据 安全 性 高 ， 是 目前 综合 性 能 最 佳 的 数据 保护 
解决 方案 。RAID 5 把 校 验 数据 分 散在 了 不 同 数据 盘 上 ， 避 免 了 RAID 3 中 写 性 能 受到 校 
验 盘 限 制 的 问题 ，4 盘 或 以 上 的 RAID 5 支持 数据 的 并 行 /并 发 读 写 操作 。RAID 5 的 缺点 
在 于 写 消 耗 太 大 ， 一 次 写 操作 包含 了 写 数 据 块 、 读 取 同 条 带 的 数据 块 、 计 算 校 验 值 、 写 
入 校 验 值 等 多 个 操作 ， 对 写 性 能 有 一 定 的 影响 。RAID 5 适用 于 随机 数据 存储 、 安 全 性 要 
求 高 的 应 用 ， 如 邮件 服务 器 、 文 件 服务 器 等 。 

RAID 6 的 优点 在 于 安全 性 非常 高 , 同时 读 写 性 能 较 好 。 当 两 个 磁盘 同时 失效 时 , RAID 
6 阵列 仍 能 够 继续 工作 ， 并 通过 求解 两 元 方程 来 重建 两 个 磁盘 上 的 数据 。RAID 6 继承 了 
RAID 3/RAID 5 的 读 写 特性 ， 读 性 能 非常 好 ; 缺点 在 于 它 有 两 个 校 验 数据 ， 写 操作 消耗 
比 RAID 3/RAID 5 更 大 ， 并 且 设 计 和 实施 相对 复杂 ， 适 用 于 安全 性 要 求 非常 高 的 应 用 。 

RAID 01 兼 具 RAID 1 和 RAID 0 的 优点 ， 有 具有 与 RAID 1 一 样 的 容错 能 力 ， 与 RAID 0 
一 样 的 高 1/0 宽带 ; 缺点 在 于 重 构 粒 度 太 大 ， 存 储 空间 利用 率 低 。RAID 01 对 一 个 RAID 0 
子 组 进行 整体 的 镜像 备份 ， 子 组 内 一 块 盘 失 效 ， 将 引起 整个 子 组 磁盘 进行 重 构 : 此 外 ， 
RAID 01 内 部 都 采用 RAID 1 模式 ， 因 此 整体 磁盘 利用 率 均 仅 为 50%。 

RAID 10 的 优点 和 RAID 01 一 样 ， 具 有 与 RAID 1 一 样 的 容错 能 力 ， 与 RAID 0 一 样 
也 具有 较 高 的 1/0 宽带 ;此 外 ，RAID 10 利用 多 个 RAID 1 子 组 做 RAID 0， 子 组 内 一 块 磁 
盘 失 效 ， 可 以 利用 其 子 组 内 镜像 盘 进 行 单 盘 快速 重 构 ; 缺点 在 于 磁盘 利用 率 也 只 有 50%。 
RAID 10 适用 于 数据 量 大 、 安 全 性 要 求 高 的 应 用 ， 如 银行 、 金 融 等 领域 的 数据 存储 。 

RAID 50 的 优点 在 于 可 靠 的 数据 存储 和 优秀 的 整体 性 能 ， 即 使 两 个 位 于 不 同 子 组 的 
物理 磁盘 发 生 故 障 ， 数 据 也 可 以 顺利 恢复 过 来 。 此 外 ， 相 对 于 同 数 量 盘 的 RAID 5 而 言 ， 
由 于 RAID 50 校 验 数据 位 于 RAID 5 子 磁盘 组 上 ， 重 建 速度 也 有 很 大 提高 。 特 别 是 各 RAID 
5 子 磁盘 组 采用 条 带 化 方式 进行 存储 , 写 操作 消耗 更 小 , 具备 更 快 的 数据 读 取 速率 。RAID 
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50 缺点 在 于 磁盘 故障 时 影响 阵列 整体 性 能 ,故障 后 重建 信息 的 时 间 也 比 镜像 配置 情况 下 
要 长 。RAID 50 适用 于 随机 数据 存储 、 安 全 性 要 求 高 、 并 发 能 力 要 求 高 的 应 用 ， 如 邮件 
服务 器 ，WWW 服务 器 等 。 

表 4-1 列 出 上 述 常用 RAID 级 别 的 技术 特点 , 从 表格 的 对 比 项 可 以 看 出 , 理想 的 RAID 
类 型 ， 或 者 是 满足 用 户 所 有 需求 的 RAID 类 型 并 不 存在 。 用 户 选择 RAID 类 型 时 ， 应 根据 
实际 应 用 需求 ， 综 合 读 写 速度 、 安 全 性 和 成 本 进行 考虑 ”。 值 得 注意 的 是 ， 从 理论 上 而 
言 ， 侯 盘 阵 列 中 (RAID 1 除外 ) 成 员 盘 越 多 性 能 越 好 。 但 在 实际 应 用 中 ， 随 着 RAID 组 
人 磁盘 数 变 多 , 磁盘 失效 次 数 也 会 相应 增加 。 因 此 ,每 个 RAID 组 中 不 建议 包含 太 多 数量 的 
物理 磁盘 。 


表 4-1 i RAID 级 别 的 比较 


RAID A | RAIDO | RAID1 | RAID3 | RAIDS | RAID 6 [RAID 10/01| RAID 50 | 
二 mm en 
奇偶 校 验 ee 
| 有 有 


入 本物 中 
随机 写 性 能 高 低 
最 小 磁盘 数 2 块 2 块 


4.3 ”RAID 数据 保护 

































4.3.1 热 备 盘 


热 备 CHot Spare) 是 指 当 RAID 组 中 某 个 磁盘 失效 时 ， 在 不 干扰 当前 RAID 系统 正 
常 工作 的 情况 下 ， 用 一 个 正常 的 备用 磁盘 顶替 失效 磁盘 ” 。 

热 备 需要 通过 配置 热 备 盘 来 实现 ， 热 备 盘 是 指 一 个 正常 的 、 可 以 用 来 顶替 RAID 组 
失效 磁盘 的 备用 磁盘 ， 可 分 为 全 局 热 备 盘 和 局 部 热 备 盘 。 全 局 热 备 盘 是 指 可 以 被 不 同 
RAID 组 共用 的 热 备 笨 ， 可 以 代替 任何 磁盘 组 中 的 任何 失效 磁盘 ;局 部 热 备 盘 是 指 仅 被 某 
-特定 的 RAID 组 使 用 的 热 备 盘 ， 这 个 特定 组 以 外 的 其 他 RAID 组 里 出 现 磁盘 失效 ， 局 部 
热 备 盘 不 会 被 投入 使 用 。 管 理 员 如 何 配置 热 备 磁盘 ? 热 备 盘 需 要 几 块 磁盘 ? 这 些 问题 是 
根据 具体 情况 而 定 的 。 ee 正常 情况 下 ， 每 个 RAID 组 都 应 
该 配置 一 个 自己 的 局 部 热 备 盘 ， 当 一 个 磁盘 失效 时 ， 各 自 都 有 一 个 备用 磁盘 可 用 。 但 在 磁 
盘 数 量 不 足 的 情况 下 ， 古 庆 由 趟 天 同 的 RAID 组 中 配置 一 个 全 局 热 备 盘 ， 同 一 时 间 只 有 
一 个 磁盘 发 生 故 障 的 话 , 对 4 个 RAID 组 来 说 , 一 块 全 局 热 备 盘 也 能 有 效 地 防止 数据 丢失 。 
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通常 来 说 ， 在 创建 RAID 组 的 时 候 要 求 尽量 使 用 同一 厂商 的 同一 型 号 磁盘 ， 保 持 磁 
ER 
员 磁 盘 的 可 用 容量 、 读 写 性 能 、 接 口 速率 均 以 最 低 配置 的 磁盘 为 准 ， 造 成 性 能 和 容量 的 
无 谓 浪费 。 因 此 ， 选 择 热 备 盘 时 ， 要 求 热 备 盘 的 容量 大 于 等 于 失效 磁盘 的 容量 ， 建 议 热 
备 盘 类 型 与 失效 RAID 组 中 的 磁盘 类 型 相同 。 


4.3.2 预 拷贝 


预 拷 贝 是 指 系统 通过 监控 发 现 RAID 组 中 某 成 员 盘 即将 发 生 故 障 时 ， 将 即将 故障 成 
员 盘 中 的 数据 提前 拷贝 到 热 备 盘 中 。 预 拷贝 是 磁盘 阵列 的 一 种 数据 保护 方式 ， 能 有 效 降 
低 数据 丢失 风险 ， 大 大 减少 重 构 事件 发 生 的 概率 ， 提 高 系统 的 可 靠 性 。 如 图 4-22 所 示 ， 
预 拷 贝 过 程 主要 包括 三 个 步骤 : 

(1) 正常 状态 时 ， 实 时 监控 磁盘 状态 ; 

(2) 当 某 个 磁盘 疑似 出 现 故 障 时 ， 将 该 盘 上 的 数据 拷贝 到 热 备 盘 上 ; 

(3) 拷贝 完成 后 ， 若 有 新 盘 替 换 故 障 盘 时 ， 再 将 数据 迁移 回 新 盘 上 。 


rr 十 
四 控 硬盘 状态 











数据 航 热 备 盘 
4 On 
| 障 时 ， 将 该 盘 上 的 数据 

迁移 到 热 备 盘 疑似 故障 盘 热 备 盘 
Ce 区 一 ™ mw 

迁移 完成 后 ， 用 新 盘 替换 

掉 故 障 盘 ， 数 据 会 复制 到 

新 更 换 的 硬盘 上 


热 备 盘 
图 4-22 ie 


预 拷 贝 技术 的 应 用 前 提 是 系统 能 检测 到 即将 故障 的 磁盘 ， 并 且 系 统 中 配置 有 热 备 
盘 。 对 于 存储 设备 来 说 ， 预 拷贝 非常 有 效 。 大 多 数 企业 级 磁盘 设备 都 配 有 一 个 名 为 SMART 
的 工具 ， 负 责 磁 盘 自 我 监测 、 分 析 和 报告 ， 有 具体 地 ，SMART 工具 不 断 从 磁盘 上 的 各 个 传 
感 器 收集 信息 ， 并 把 信息 保存 在 磁盘 的 系统 保留 区 ” 。 利 用 这 个 工具 可 以 监视 磁盘 的 健 
康 状 况 ， 包 括 检 查 磁盘 的 旋转 速度 、 温 度 、 通 电 次 数 、 通 电 数 据 累 计 、 写 错误 率 等 ， 因 
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此 ， 配 有 SMART 工具 的 磁盘 也 被 称 为 智能 磁盘 。 系 统 会 实时 从 智能 磁盘 的 SMART 信息 中 
读 取 磁 盘 的 状态 信息 ， 当 发 现 磁盘 错误 统计 超过 设 定 的 阀 值 后 ， 立 即将 数据 从 疑似 故障 
的 磁盘 中 拷贝 到 热 备 盘 里 ， 同 时 向 管理 人 员 报 警 ， 提 醒 更 换 疑 似 故障 的 磁盘 。 


4.3.3 ”失效 重 构 


重 构 是 指 当 RAID 组 中 某 个 磁盘 发 生 故障 时 ， 根 据 RAID 中 的 奇偶 校 验算 法 或 镜像 策 
上 ， 利 用 其 他 正常 成 员 盘 的 数据 ， 重 新 生成 故障 磁盘 数据 的 过 程 “。 重 构 内 容 包括 用 户 
数据 和 校 验 数据 ， 最 终 将 这 些 数据 写 到 热 备 盘 或 者 替换 的 新 磁盘 上 。 

如 图 423 所 示 ， 假 设 磁盘 0 磁盘 1 和 磁盘 2 组 成 了 一 个 RAID 3， 其 中 ， 碰 盘 2 
为 检验 盘 ， 磁 盘 3 为 热 备 盘 。 如 果 磁 盘 0 由 于 某 种 原因 导致 盘 发 生 故 障 ， 数 据 块 D0、D2、 
D4 丢失 , 那么 磁盘 控制 器 就 可 以 利用 磁盘 1 上 的 用 户 数据 和 磁盘 2 上 的 检验 数据 进行 异 
或 运算 ， 重 新 构造 出 磁盘 0 中 的 数据 块 D0、D2、D4， 并 写 入 热 备 盘 中 ， 待 新 盘 替 换 故 障 
盘 之 后 ， 再 将 热 备 盘 中 的 数据 复制 回 新 盘 。 当 然 ， 如 果 系 统 没 有 设置 热 备 盘 ， 则 可 以 用 
新 盘 替 换 故 障 盘 ， 直 接 将 重 构 好 的 数据 写 入 新 盘 中 。 


AO、Al、B0O、Bi、C0、C1 、… 














-人 
会 - 痢 - 二 二 -本 二 
微 盘 故 障 数据 重 构 热 备 盘 
图 4-23 ”数据 重 构 

在 正常 工作 情况 下 ，RAID 组 中 出 现成 员 磁 盘 失 效 时 就 会 进入 降级 状态 并 触发 重 构 。 
成 功 触 发 重 构 需 要 具备 如 下 三 个 前 提 : 

(1) 阵列 中 有 成 员 盘 故障 或 数据 失效 ; 

(2) 阵列 中 配置 有 热 备 盘 且 没有 被 其 他 RAID 组 占用 ， 或 者 新 盘 替 换 了 故障 盘 ; 

(3) RAID 级 别 应 配置 成 RAID 1、RAID 3、RIAD 5、RAID 6、RAID 10 或 RAID 50 等 
元 余 阵 列 。 

如 果 要 保证 阵列 可 以 继续 工作 ， 不 中 断 上 层 业 务 ， 那 么 重 构 过 程 不 能 影响 RAID 组 
进行 读 写 操作 ， 和 否则 需要 暂停 业务 。 

磁盘 预 捞 贝 技术 和 失效 重 构 存 在 一 些 差异 。 最 大 区 别 在 于 : 预 拷贝 是 在 数据 失效 之 
前 将 其 备份 到 热 备 盘 里 ， 而 重 构 是 在 数据 失效 之 后 利用 相应 算法 进行 数据 恢复 ， 前 者 动 
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作 在 磁盘 故障 之 前 ， 后 者 动作 在 磁盘 故障 之 后 。 通 常情 况 下 ， 重 构 需 要 更 长 的 时 间 和 更 
多 的 计算 资源 ， 相 比 而 言 ， 磁 盘 预 拷贝 技术 具备 低 风险 、 高 效率 等 优势 。 然 而 ， 不 是 所 
有 的 磁盘 故障 都 能 事先 检测 到 的 ， 所 以 不 是 任何 情况 下 都 可 以 使 用 预 拷贝 技术 ， 在 这 种 
情况 下 ， 数 据 重 构 技术 就 显得 非常 重要 。 

如 图 4-24 所 示 ， 磁 盘 预 拷贝 技术 只 是 两 个 磁盘 之 间 的 单纯 的 数据 拷贝 过 程 ， 速 度 
快 且 不 涉及 各 种 校 验 计算 ， 也 无 需 用 到 其 他 正常 成 员 盘 中 的 数据 ， 上 次 业务 不 会 中 断 。 
而 重 构 过 程 中 要 涉及 RAID 中 的 多 个 成 员 盘 , 大量 数 据 读 写 易 导致 磁盘 损坏 且 占 用 后 端 带 
宽 ， 各 种 校 验 计算 需要 时 间 较 长 ， 影 响 系 统 性 能 ， 可 能 会 导致 业务 中 断 。 





图 4-24 磁盘 预 拷贝 技术 和 重 构 的 差异 


磁盘 预 拷贝 技术 可 以 充分 利用 从 检测 到 磁盘 即将 失效 至 磁盘 真正 失效 的 这 段 时 间 ， 
将 数据 拷贝 到 热 备 盘 中 ， 从 而 降低 数据 丢失 的 风险 。 在 整个 预 拷贝 过 程 中 ，RAID 组 处 于 
正常 状态 ,所 有 成 员 盘 均 处 于 可 用 状态 , 而 且 RAID 组 的 用 户 数据 和 检验 数据 都 是 完整 的 ， 
用 户 数据 无 丢失 的 风险 ， 可 以 正常 地 响应 主机 的 1/0 请 求 。 而 在 重 构 过 程 中 ，RAID 组 处 
于 降级 状态 ，RAID 组 的 用 户 数据 或 检验 数据 是 不 完整 的 ， 用 户 数据 处 于 高 风险 状态 。 虽 
然 重 构 过 程 中 也 可 以 响应 主机 下 发 的 I/0 请 求 ， 但 由 于 故障 盘 之 外 的 成 员 盘 也 需 参与 重 
构 ， 响 应 性 能 将 大 大 降低 。 如 果 重 构 期 间 再 次 出 现 其 他 磁盘 故障 ， 对 于 RAID 3、RAID 5 
等 单 重 见 余 保护 阵列 ， 用 户 数 据 就 会 丢失 ， 即 使 是 RAID 6 和 使 用 镜像 技术 的 多 盘 RAID 
1 这 样 的 拥有 多 重 元 余 保护 的 阵列 , 一旦 故障 磁盘 数 超过 元 余 磁盘 数 , 用 户 数据 同样 会 
丢失 。 


4.3.4 ”RAID 状态 


RAID 技术 将 多 个 物理 磁盘 组 合 在 一 起 形成 一 个 RAID 组 ，RAID 组 需要 维护 自身 的 状 
态 ， 如 图 4-25 所 示 ，RAID 组 存在 创建 、 正 常 工作 、 降 级 和 失效 4 种 状态 。 

首先 ， 系 统 按 用 户 配 置 将 若干 物理 磁盘 组 建成 RAID 组 ， 当 RAID 组 创建 成 功 后 ， 所 
有 磁盘 都 正常 工作 时 ，RAID 组 就 进入 了 正常 工作 状态 。 正 常 工 作 状 态 下 如 有 一 定数 量 的 
磁盘 掉 线 或 者 故障 ， 但 整个 RAID 组 仍然 能 够 保证 数据 是 可 用 的 ，RAID 组 就 进入 了 降级 
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状态 。 在 降级 状态 下 ,对 故障 的 磁盘 进行 更 换 或 者 使 用 系统 中 热 备 盘 ,再 触发 数据 重 构 ， 
通过 重 构 将 数据 恢复 到 新 盘 或 热 备 盘 中 ,成 功 恢复 丢失 数据 之 后 ，RAID 组 将 重新 进入 正 
常 工 作 状 态 。 但 如 果 在 重 构 过 程 中 , 发生 新 的 磁盘 故障 ， 且 故障 磁盘 数 超过 该 RAID 类 型 
所 支持 的 元 余 磁 盘 数 , 就 会 造成 数据 永久 丢失 ,此 时 整个 RAID 组 失效 。 降 级 状态 下 RAID 
组 能 否 完 成 数据 重 构 ,取决 于 使 用 的 RAID 类 型 、 磁 盘 故 障 的 数量 和 和 蔡 换 的 磁盘 的 可 用 性 。 





创建 成 功 成 员 盘 掉 线 或 故障 故障 盘 数 超过 宛 余 盘 数 
Fa i ae 
De 
数据 成 功 重 构 


图 4-25 RAID 状态 


nih 4.4 LUN 虚拟 化 


RAID 技术 的 设计 初衷 是 将 几 块 小 容量 廉价 的 磁盘 组 合成 一 个 大 的 逻辑 磁盘 给 大 型 
机 使 用 。 随 着 磁盘 技术 的 不 断 发 展 ， 单 个 磁盘 的 容量 不 断 增 大 , 组建 RAID 的 目的 就 不 限 
于 构建 一 个 大 容量 的 磁盘 ， 而 是 利用 并 行 访问 技术 和 数据 编码 方案 来 分 别提 高 磁盘 的 读 
写 性 能 和 数据 安全 性 。 目 前 ， 单 个 磁盘 容量 已 经 较 大 (如 2016 年 希捷 推出 10TB 人 硬盘)， 
多 个 磁盘 组 建 的 RAID 磁盘 组 容量 则 更 大 ， 此 时 ， 大 容量 的 一 个 磁盘 阵列 ,是 映射 给 一 台 
主机 使 用 还 是 共享 给 多 台 主 机 ? 如 果 把 整个 RAID 组 作为 一 个 逻辑 单元 映射 给 一 台 主 机 
使 用 ， 就 有 可 能 造成 存储 资源 的 浪费 ， 因 为 不 是 所 有 的 主机 都 需要 如 此 大 的 存储 空间 。 
如 果 通 过 增 减 阵列 成 员 磁 盘 的 方式 适应 主机 存储 空间 的 需求 , 那么 会 造成 两 种 消极 影响 : 
(1) 影响 阵列 整体 的 存储 性 能 ， 因 为 磁盘 数目 过 少 性 能 将 得 不 到 很 好 的 提升 ， 磁 盘 数目 
过 多 故障 率 会 越 高 ， 失 效 重 构 会 影响 用 户 响 应 性 能 ; (2) 影响 存储 空间 的 利用 率 ， 增 减 
磁盘 意味 着 存储 容量 调整 粒度 是 单个 磁盘 容量 ， 主 机 可 能 只 使 用 一 小 部 分 空间 ， 造 成 存 
储 空间 的 闲置 和 浪费 。 

为 了 更 好 地 提高 阵列 存储 性 能 和 存储 空间 利用 率 ， 设 计 者 提出 了 一 种 RAID 组 进行 
细 粒 度 切 分 管理 方案 ， 即 LUN 虚拟 化 。 具 体 地 ， 将 一 个 RAID 组 划分 成 多 个 逻辑 单元 ,并 
分 别 映射 给 多 台 主 机 使 用 ;， 同 时 ， 一 个 主机 也 可 以 使 用 多 个 逻辑 单元 。 

逻辑 单元 号 〈Logical Unit Number，LUN) 本 身 用 于 标记 逻辑 单元 ， 后 来 人 们 系统 
地 用 LUN 来 指 代 罗 辑 单元 。 如 图 4-26 所 示 ， 多 个 硬盘 既 可 以 构成 一 个 LUN， 也 可 以 创建 
出 多 个 LUN。 
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局 国 国 图 


(a) 单个 RAID 组 上 创建 1 个 LUN Cb) 单个 RAID 组 上 创建 多 个 LUN 
图 4-26 RAID 和 LUN 的 关系 





若干 个 侯 盘 组 成 一 个 RAID 组 ， 从 逻辑 的 和 角度， 多 个 磁盘 组 成 了 一 个 大 物理 卷 ， 物 
理 卷 按照 指定 容量 创建 一 个 或 多 个 LUN，LUN 可 以 灵活 地 映射 给 主机 使 用 。 

设 定好 相关 映射 之 后 ， 主 机 可 以 看 到 分 配给 它 的 磁盘 ， 即 RAID 组 中 划分 出 的 LUN。 
此 时 主机 便 可 以 进行 分 区 、 格 式 化 等 常规 磁盘 的 操作 。 在 主机 看 来 ， 这 个 LUN 和 一 个 普 
通 的 物理 磁盘 没有 什么 区 别 ， 即 LUN 对 主机 是 透明 的 ， 主 机 无 需 知道 这 个 LUN 是 来 自 一 
块 普通 的 物理 磁盘 还 是 一 个 磁盘 阵列 ， 也 无 需 知道 磁盘 阵列 的 具体 配置 (如 磁盘 数量 、 
RAID 级 别 )。 

为 了 更 好 地 使 用 LUN， 操 作 系 统 通常 采用 卷 管理 器 来 管理 存储 空间 。 为 了 更 好 地 理 
解 逻辑 卷 ， 这 里 先 解释 几 个 相关 概念 。 

逻辑 卷 管理 器 (Logical Volume Manager，LVM): 位 于 操作 系统 和 存储 设备 之 间 ， 
是 将 操作 系统 识别 到 的 磁盘 进行 组 合 再 分 配 的 软件 。LVM 屏蔽 了 存储 设备 映射 给 主机 的 
物理 磁盘 或 逻辑 磁盘 的 复杂 性 ， 通 过 将 这 些 磁盘 做 成 卷 ， 以 逻辑 卷 的 方式 灵活 地 呈现 给 
操作 系统 磁盘 管理 器 。 

物理 卷 (Physical Volume，PV): 存储 设备 映射 给 主机 使 用 的 LUN 或 物理 磁盘 ， 都 
将 被 操作 系统 识别 为 一 个 物理 磁盘 ， 这 个 物理 磁盘 在 卷 管理 器 层面 上 被 称 为 物理 卷 。 创 
建 PV 时 ， 可 以 把 整个 磁盘 当成 一 个 PV， 也 可 以 将 磁盘 的 一 部 分 创建 为 一 个 PV。 

卷 组 (Volume Group，VG): 多 个 PV 首尾 相连 ， 组 成 了 一 个 逻辑 上 连续 编 址 的 卷 组 ， 
VG 的 形成 相当 于 屏蔽 了 底层 多 个 物理 磁盘 的 差异 , 向 上 可 以 提供 一 个 统一 管理 的 磁盘 资 
源 池 ， 实 现存 储 空间 的 动态 分 配 。 | 

逻辑 卷 (Logical Volume，LV): 是 逻辑 卷 管理 器 对 存储 映射 给 主机 的 LUN、 物 理 磁 
盘 或 物理 磁盘 分 区 进行 整合 ， 再 划分 出 来 的 一 个 虚拟 磁盘 分 区 。LV 是 在 VG 中 创建 的 最 
终 可 供 操作 系统 使 用 的 卷 。 

如 图 4-27 所 示 ， 若 干 个 磁盘 组 成 了 一 个 RAID 组 ， 在 RAID 组 中 按照 指定 容量 创建 
一 个 或 多 个 LUN 映射 给 主机 使 用 ，LUN 在 LVM 上 被 称 为 PV， 多 个 物理 卷 逻辑 上 连续 编 址 
形成 了 一 个 VG, 在 这 个 卷 组 上 再 划分 出 了 一 个 个 LY。 逻辑 卷 将 被 提供 给 操作 系统 的 磁盘 
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管理 器 进行 分 区 、 格 式 化 等 。 


逻辑 卷 










I 
SD Si 会 RAID 组 上 创建 多 个 LUN 


RAID 组 


图 4-27 RAID 组 与 逻辑 卷 的 关系 


对 于 操作 系统 而 言 ， 轴 辑 卷 就 像 一 个 物理 磁盘 ， 可 以 像 操作 本 地 磁盘 分 区 一 样 来 管 
理 逻 辑 卷 ， 比 如 在 逻辑 卷 之 上 创建 一 个 文件 系统 ， 逻 辑 卷 的 实际 组 成 对 操作 系统 是 透明 
的 。 如 图 4-27 所 示 ， 人 逻辑 卷 可 以 由 不 连续 的 物理 分 区 组 成 ， 也 可 以 跨越 多 个 物理 卷 。 相 
对 于 将 LUN 映射 给 主机 直接 安装 文件 系统 进行 使 用 ， 在 逻辑 卷 上 建立 文件 系统 对 存储 空 
间 进 行 管理 具有 以 下 三 方面 优势 。 

(1) 存储 容量 。 逻 辑 卷 可 以 跨越 物理 磁盘 甚至 是 RAID 卡 ， 可 随意 扩容 ， 而 LUN 划 
分 好 之 后 就 无 法 增 减 容量 ， 除 非 抹 掉 所 有 数据 进行 重新 划分 ， 过 程 复杂 且 成 本 高 。 

(2) 访问 性 能 。 逻 辑 卷 可 以 通过 配置 来 为 应 用 程序 提供 优化 的 性 能 。 

(3) 数据 安全 性 。 逻 辑 卷 可 以 通过 配置 内 部 镜像 来 提高 数据 的 安全 性 。 





本 章 介绍 了 传统 RAID 技术 及 其 应 用 ， 主 要 针对 传统 RAID 技术 的 基本 概念 、 相 关 技 
术 进 行 了 阐述 。 其 中 ， 首 重 介绍 了 基于 硬件 和 软件 的 两 种 RAID 的 实现 方式 ， 各 RAID 级 
别 及 其 优 缺 点 ， 条 带 化 的 数据 组 织 技术 ， 基 于 镜像 或 奇偶 校 验 的 数据 元 余 方式 ， 采 用 热 
备 盘 、 预 拷贝 或 重 构 的 数据 保护 相关 技术 ，RAID 和 LUN 以 及 逻辑 卷 的 关系 。 
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练习 题 


一 、 判 断 题 
1. 所 有 的 RAID 级 别 都 具备 容错 能 力 。(  ) 
2. 如 果 业 务 是 随机 小 I/0 较 多 的 情况 ，RAID 5 比 RAID 10 性 能 好 。( ) 
3. 在 RAID 10 中 ， 任 意 两 块 磁盘 出 现 故 障 都 不 影响 读 取 数 据 。( ) 
、 选 择 题 
. 下列 哪 些 级 别 的 RAID 提供 元 余 ) 
RAID 0 B. RAID 1 C. RAID 5 D. RAID 10 
.下 列 对 于 RAID 6 的 描述 ， 哪 项 是 不 正确 的 ) 
.通常 RAID 6 技术 包括 RAID 6 P+Q 技术 和 RAID 6 DP 技术 
RAID 6 要 求 双重 奇偶 校 验 
RAID 6 至 少 要 求 3 块 硬盘 
RAID 6 可 以 在 两 块 成 员 盘 失效 的 情况 下 恢复 数据 
填空 题 

1. 在 传统 RAID 相关 数据 保护 技术 中 ，( ) 是 在 数据 失效 之 前 将 其 备份 到 
热 备 盘 里 ， 而 ( ) 是 在 数据 失效 之 后 利用 相应 算法 进行 重新 构造 。 在 数据 满 盘 
的 情况 下 ，( ) 需要 更 长 的 时 间 和 更 多 的 计算 资源 。 

2. 几 个 磁盘 组 成 了 一 个 RAID 组 ， 在 RAID 组 中 按照 指定 容量 创建 一 个 或 多 个 
( ) 映射 给 主机 使 用 ， 在 卷 管理 器 上 被 称 为 了 污 弛 个 ) 
逻辑 上 连续 编 址 形成 了 一 个 卷 组 ， 在 这 个 卷 组 上 再 划分 出 了 一 个 个 过 

四 、 思 考题 

1. 理论 上 数据 写 入 性 能 与 RAID 组 中 的 数据 盘 的 数量 成 正比 ， 实 际 上 是 这 样 的 吗 ? 
为 什么 ? 


中 


| 


2. 如 果 一 个 具有 数据 校 验 元 余 保护 的 RAID 组 中 出 现 一 个 磁盘 失效 , 在 什么 情况 下 ， 
利用 预 拷 贝 技 术 恢 复数 据 所 需 时 间 比 利用 重 构 技 术 的 时 间 更 长 ? 


3. 参照 RAID 10 的 工作 原理 ， 请 对 RAID 01 的 工作 原理 进行 简单 分 析 。 


-0 = 





第 5 贡 
RAID 2.0+ 技 术 





5.1 RAID 2.0+ 技 术 原 理 
5.2 ” RAID 2.0+ 应 用 

5.3 本章 小 结 

练习 题 





硬盘 容量 快速 增长 ， 而 读 写 速度 却 增长 缓慢 ， 按 照 传 统 RAID 组 重 构 方 式 ， 重 构 时 
闻 将 大 幅 增加 ， 从 而 导致 “ 重 构 时 间 增 加 ， 重 构 期 间 硬 盘 故 障 概率 增加 ， 数 据 丢 失 风险 
随 之 增 大 ”这 一 问题 。 针 对 此 问题 ， 一 些 存 储 公 司 将 磁盘 阵列 从 基于 磁盘 的 RAID 发 展 成 
基于 块 虚拟 化 的 RAID 2. 0/RAID 2. 0+ 技 术 ， 不 仅 大 大 降低 重 构 时 间 ， 提 高 系统 可 靠 性 ， 
而 且 充 分 满足 虚拟 机 环境 对 存储 的 应 用 需求 。 本 章 重点 介绍 RAID 2. 0/RAID 2. 0+ 技 术 ， 
特别 是 RAID 2. 0+ 技 术 的 工作 原理 。 





ee , 
Eh ia 。 了 解 RAID 2. 0+ 技 术 的 发 展 ; 
了。 掌握 RAID 2. 0+ 技 术 的 工作 原理 ; | 
上 上 目 = D9。 热 悉 RAID 2. 0+ 技 术 的 体系 结构 及 软件 远 辑 对 象 

由 后 。 了 和 解 RAID 2. 0+ 技 术 的 优势 ; : 





5.1.1 RAID 技术 发 展 过 程 


第 4 章 已 经 系统 地 介绍 了 传统 RAID 阵列 技术 。RAID 技术 的 设计 初衷 在 于 把 多 个 独 
立 的 物理 磁盘 通过 相关 算法 组 合成 一 个 虚拟 逻辑 磁盘 ， 给 大 型 计算 机 提供 更 大 容量 。 随 
着 做 盘 技术 地 不 断 发 展 ， 磁 盘 的 容量 不 断 增 大 ， 构 建 RAID 不 仅仅 考虑 大 容量 存储 空间 ， 
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还 需要 考虑 性 能 和 安全 性 ， 于 是 采用 条 带 化 数据 组 织 技术 和 数据 元 余 策 略 来 分 别提 升 存 
储 性 能 及 安全 性 。 

此 外 ， 高 性 能 应 用 不 断 涌 现 ， 对 数据 的 存储 需求 也 不 断 增 长 ， 传 统 RAID 出 现 了 越 
来 越 多 的 问题 : (1) 随 着 单 块 磁盘 的 容量 达到 数 TB 级 别 ， 传 统 RAID 技术 在 磁盘 重 构 过 
程 中 需要 的 时 间 越 来 越 长 ,而且 繁 重 的 读 写 操 作 有 可 能 引起 RAID 组 中 其 他 磁盘 出 现 故 障 
或 错误 ， 从 而 导致 故障 概率 大 幅 提升 ， 增 加 数据 丢失 的 风险 : (2) 传统 RAID 中 磁盘 数量 
不 多 ， 无 法 满足 企业 在 大 型 计算 、 海 量 数据 存储 应 用 方面 对 存储 资源 统一 灵活 调配 的 需 
求 ; (3) 一 个 LUN 的 读 写 只 能 在 一 个 磁盘 组 进行 ， 如 果 后 面 新 加 入 性 能 较 高 的 介质 ， 也 
无 法 充分 利用 其 性 能 ; 〈4) 以 磁盘 为 单位 的 数据 管理 无 法 有 效 地 保障 数据 访问 性 能 和 存 
储 空 间 利 用 率 。 既 然 传 统 RAID 阵列 技术 已 经 不 能 满足 行业 的 需求 , 而 随 着 虚拟 化 技术 的 
不 断 发 展 ，LUN 虚拟 化 和 块 虚拟 化 技术 被 提出 ， 相 继 出 现 了 RAID 1.5 技术 和 RAID 2.0 
技术 。 图 5-1 为 RAID 2. 0 技术 发 展 过 程 。 


和 ss 是 恒 
i Se 
介 个 La 
人 全 二 Ee 
| 人 人 人 局 加 地 霹 本 ed 


传统 RAID 区 多 LUN 虚拟 化 区 办 RAID 2.0 


图 5-1 RAID 2.0 技术 的 发 展 


众多 存储 厂商 提出 了 LUN 虚拟 化 的 存储 方案 ， 以 EMC 和 HDS 为 代表 的 存储 厂商 提出 
了 RAID 1. 5 技术 , 它 是 在 传统 RAID 基础 之 上 将 RAID 组 进行 更 细 粒 度 地 切 分 , 将 多 个 RAID 
组 切 分 成 大 小 相等 的 逻辑 空间 ， 再 利用 这 些 逻 辑 空间 组 合 ， 构 建 出 主机 可 访问 的 罗 辑 存储 
单元 ， 即 LUN 虚拟 化 。LUN 虚拟 化 技术 使 得 单个 LUN 中 数据 的 存 取 跨越 了 更 多 的 磁盘 ， 性 
能 得 到 了 有 效 提升 。 此 外 ， 由 于 单个 LUN 的 存储 空间 可 以 来 自 于 多 个 RAID 组 ， 可 以 在 不 同 
类 型 磁盘 或 不 同 级 别 RAID 组 之 间 实 现 数据 迁移 ， 以 平衡 存储 性 能 与 存储 空间 的 使 用 ， 有效 


于 是 众 厂商 又 纷纷 提出 了 块 虚拟 化 技术 。 以 华为 和 HE 3PAR 为 代表 的 存储 厂商 将 存储 池 中 


的 磁盘 划分 成 一 个 个 小 粒度 的 数据 块 空间 ， 基 于 块 来 构建 RAID 组 , 使 得 数据 均匀 地 分 布 到 
存储 池 中 所 有 磁盘 上 ， 然 后 以 块 为 单元 来 进行 存储 资源 管理 ， 这 就 是 RAID 2. 0 技术 。 


= MS 
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华为 公司 在 传统 RAID 技术 基础 上 ， 设 计 研 发 了 一 种 底层 块 虚拟 化 (Virtual for 
Disk) 和 上 层 LUN 虚拟 化 (Virtual for Pool) 的 双 层 虚拟 化 技术 ， 用 于 满足 存储 技术 
虚拟 化 架构 发 展 趋势 ， 即 RAID 2. 0+ 技 术 。 在 块 虚 拟 化 层面 上 ， 逻 辑 上 将 物理 磁盘 空间 
切 分 成 块 ， 以 这 些 块 为 对 象 实现 RAID 算法 ， 即 每 个 逻辑 块 充当 一 个 RAID 成 员 盘 ， 用 于 
组 建 RAID 组。 在 LUN 虚拟 化 层面 上 ， 将 这 些 RAID 组 进行 更 细 粒 度 地 切 分 ， 切 分 成 固定 
大 小 的 Extend， 再 利用 这 些 Extend 组 合 构建 主机 可 访问 的 LUN。 这 种 存储 空间 管理 机 制 
使 得 数据 保护 的 级 别 精细 化 到 数据 块 ， 从 而 提供 了 更 好 的 数据 读 写 效 率 和 数据 保护 。 此 
外 , RAID 2. 0+ 在 底层 块 级 虚拟 化 磁盘 管理 的 基础 之 上 , 通过 一 系列 Smart 软件 提升 效率 ， 
实现 了 上 层 LUN 虚拟 化 的 高 效 资源 管理 。 


5.1.2 ”RAID 2.0+ 基 本 原理 


在 传统 RAID 技术 中 , 利用 独立 的 物理 磁盘 创建 RAID 组 ,然后 在 RAID 组 上 划分 LUN 
映射 给 主机 使 用 ， 这 种 方式 无 法 实现 高 效 存 储 性 能 、 提 供 数 据 安全 性 。 

磁盘 阵列 2. 0+ (Redundant Array of Independent Disks Version 2.0+, RAID 2. 0+) 
采用 底层 磁盘 管理 和 上 层 资 源 管理 两 层 虚 拟 化 管理 模式 。 在 系统 内 部 ， 每 个 磁盘 空间 被 
划分 成 一 个 个 小 粒度 的 块 ， 基于 这 些 块 来 构建 RAID 组 , 使 得 数据 均匀 地 分 布 到 存储 池 的 
所 有 磁盘 上 ， 同 时 ， 以 块 为 单元 来 进行 资源 管理 ， 大 大 提高 了 资源 管理 的 效率 。 图 5-2 
为 RAID 2. 0+ 技 术 的 原理 ， 展 现 了 RAID 2. 0+ 技 术 对 物理 磁盘 进行 多 次 切 分 组 合 形成 主机 
可 用 逻辑 单元 的 过 程 。 





硬 航 0 硬盘 1 硬盘 上 硬盘 
图 5-2 RAID 2. 0+ 技 术 原 理 


首先 ， 存 储 系统 支持 不 同类 型 的 磁盘 ， 包 括 SSD 盘 、SAS 盘 、SATA 盘 和 NL-SAS 盘 "。 


” NL-SAS 硬 提 是 SATA 的 帮 体 与 SAS 连接 器 的 组 合体 ，NL-SAS 硬盘 的 转速 只 有 7200rpm， 性 能 比 10000RPM 的 SAS 硬 
盘 差 ; 由 于 使 用 了 SAS 接口 ， 在 寻 址 与 速度 上 比 SATA 硬盘 有 了 提升 。 
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由 这 些 物理 磁盘 构成 一 个 个 的 硬盘 域 (后 文 会 有 详细 介绍 ), 硬盘 域 中 相同 类 型 的 磁盘 按 
照 一 定 的 规则 被 划分 为 一 个 个 磁盘 组 ， 每 个 磁盘 的 空间 都 会 被 切 分 成 大 小 一 致 的 逻辑 块 
(Chunk，CK); 然后 以 来 自 同 一 磁盘 组 中 不 同 磁盘 上 的 逻辑 块 为 对 象 ， 按 传统 RAID 技术 实 
现 方式 组 成 RAID 组 ， 即 钦 辑 块 组 (Chunk Group，CKG); 随后 将 这 些 逻 辑 块 组 切 分 成 更 小 
粒度 的 固定 大 小 的 逻辑 存储 空间 Extent， 最 后 将 这 些 逻 辑 存 储 空间 组 成 LUN 映射 给 主机 。 

相 比 于 RAID 1.0 (传统 RAID) 和 RAID 1.5，RAID 2. 0+ 对 数据 元 余 保护 方式 的 设置 
更 加 灵活 和 精细 化 。 传统 RAID 中 的 热 备 空间 是 由 专门 的 热 备 盘 来 提供 的 , 通过 管理 员 指 
定 某 个 特定 的 磁盘 作为 热 备 盘 实 现 ， 而 RAID 2. 0+ 中 提出 了 新 的 热 备 空间 策略 : 存储 系 
统 以 磁盘 中 切 分 出 来 的 逻辑 块 〈CK) 为 存储 单位 ， 并 根据 硬盘 域 设置 的 热 备 策略 及 该 硬 
盘 域 中 各 种 类 型 磁盘 个 数 来 预 留 热 备 空间 。 热 备 空间 不 再 由 专门 的 热 备 盘 来 提供 ， 而 是 
分 散在 整个 存储 系统 的 磁盘 上 。 不 同类 型 磁盘 保留 的 热 备 空间 容量 随 着 硬盘 域 中 该 类 磁 
盘 数目 的 增加 而 增加 ， 但 磁盘 数量 并 不 按 线性 方式 增长 〈 规 律 见 表 5-1)。 其 中 ， 热 备 空 
则 只 是 相当 于 VW 个 磁盘 的 空间 而 不 是 来 自 于 独立 的 WW 个 磁盘 ， 并 且 整 个 硬盘 域 中 每 种 类 
型 的 磁盘 保留 的 最 小 热 备 空间 相当 于 一 个 此 类 型 磁盘 的 容量 。 

表 5-1 
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RAID 2. 0+ 系 统 预 留 了 相当 于 W 个 磁盘 的 容量 做 热 备 空间 ， 但 并 不 代表 该 类 磁盘 可 
以 允许 个 磁盘 同时 损坏 。 该 参数 只 是 表示 系统 会 为 该 类 型 磁盘 预 留 此 热 备 空间 用 以 文 
持 最 多 VV 个 磁盘 故障 时 的 重 构 。 至 于 系统 最 多 能 支持 多 少 个 磁盘 同时 故障 而 不 丢失 数据 ， 
取决 于 在 硬盘 域 中 划分 存储 池 时 选择 的 RAID 策略 。 考虑 到 硬盘 域 中 要 预 留 热 备 空间 , 因 
此 硬盘 域 向 上 提供 给 用 户 最 终 使 用 的 空间 等 于 硬盘 域 中 磁盘 总 容量 减 去 热 备 空间 容量 之 
后 的 净 容量 。 


5.1.3 RAID 2.0+ 体 系 结构 
RAID 2. 0+ 技 术 的 体系 架构 如 图 5-3 所 示 ， 其 实现 主要 由 若干 软件 逻辑 对 象 完成 。 
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软件 逻辑 对 象形 成 于 系统 存储 资源 的 双 层 虚拟 化 操作 ， 是 RAID 2. 0+ 技 术 的 核心 组 成 部 
分 。 本 小 节 针 对 这 些 软件 逻辑 对 象 和 概念 进行 重点 阐述 。 





存储 池 (SP) 


卷 (Volume) 





1 Grain 
0 


图 5-3 RAID 2. 0+ 技 术 软 件 逻 辑 对 象 及 关联 关系 


1]， 逻辑 磁盘 | 

逻辑 磁盘 (Logical Drive，LD) 是 被 存储 系统 所 管理 的 磁盘 ， 和 物理 磁盘 相对 应 。 
物理 磁盘 指 的 是 现实 中 的 真实 磁盘 ， 如 机 械 硬盘 、 固 态 硬盘 等 。 例 如 机 械 磁盘 是 由 实 实 
在 在 的 扇 区 组 成 的 ， 这 些 扇 区 可 能 分 布 在 不 同 磁 道 或 盘 片 上 ， 并 不 完全 连续 的 。 通 常 需 
要 结合 磁头 、 柱 面 和 扇 区 来 寻 址 〈CHS 寻 址 ) 并 访问 磁盘 上 的 数据 。 为 了 便于 管理 ， 通 
常 将 CHS 这 种 三 维 寻 址 方式 转变 为 一 维 的 线性 寻 址 ， 即 把 磁盘 上 所 有 的 物理 扇 区 通过 一 
定 的 规则 进行 线性 编号 ， 用 这 些 编号 来 表示 各 个 物理 扇 区 的 地 址 ， 也 就 是 所 谓 的 逻辑 块 
地 址 (Logical Block Addressing，LBA)。LBA 编 址 方式 使 存储 系统 避免 了 烦琐 的 CHS 
寻 址 ， 提 高 了 寻 址 效率 。 底 层 硬 件 采 用 LBA 编 址 方式 向 管理 软件 呈现 一 个 地 址 连续 的 便 
于 管理 的 虚拟 磁盘 ， 即 逻辑 磁盘 。 在 主机 访问 物理 磁盘 时 ， 先 向 逻辑 磁盘 下 发 命令 ， 再 
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由 磁盘 控制 器 将 这 种 逻辑 地 址 转换 为 实际 硬盘 的 物理 地 址 。 

2， 硬 盘 域 

硬盘 域 (Disk Domain，DD) 是 一 堆 磁 盘 的 集合 ， 一 个 DD 可 以 由 整个 系统 所 有 
磁盘 组 成 , 也 可 以 由 系统 中 部 分 磁盘 组 成 ,这些 磁盘 经 整合 后 统一 向 存储 池 提 供 存 储 
资源 。 

如 图 5-4 所 示 ， 一 个 磁盘 域 就 是 一 组 磁盘 ， 一 个 磁盘 只 能 属于 一 个 磁盘 域 ， 一 个 存 
储 系 统 可 以 创建 一 个 或 多 个 磁盘 域 。 尽管 磁盘 域 与 RAID 组 都 是 由 一 组 磁盘 构成 , 但 两 者 
在 构建 时 具有 较 大 不 同 : 在 创建 RAID 组 时 ， 这 些 独立 的 物理 磁盘 已 经 按照 某 个 RAID 组 
级 别 进行 了 绑 定 ， 并 且 要 求 RAID 组 中 成 员 磁盘 类 型 相同 、 容 量 大 小 和 转速 保持 一 致 ,成 
员 磁 盘 个 数 也 不 宜 太 多 ;而 在 创建 磁盘 域 时 ，RAID 级 别 尚 未 指定 ， 即 数据 的 元 余 保 护 方 
式 也 未 指定 ， 并 且 在 一 个 磁盘 域 中 ， 磁 盘 的 个 数 可 以 达到 上 百 个 ， 还 可 以 包含 多 种 类 型 
的 磁盘 ， 可 以 是 SSD 盘 、SAS 盘 、SATA 盘 、NL-SAS 盘 中 的 一 种 或 多 种 。 在 大 型 存储 系统 
中 ， 磁 盘 数 量 非 常 多 ， 可 以 通过 创建 多 个 磁盘 域 将 多 组 物理 磁盘 分 开 ， 实 现 磁盘 域 之 间 
故障 、 性 能 和 存储 资源 的 完全 隔离 ， 有 效 避 免 系统 中 一 块 物理 磁盘 故障 影响 到 整个 系统 
的 工作 效率 。 
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图 5-4 硬盘 域 


硬盘 域 中 ， 不 同类 型 的 磁盘 对 应 一 个 存储 层级 〈Tier )，SSD 盘 对 应 高 性 能 层 ，SAS 
盘 分 配 到 性 能 层 ，SATA 盘 和 NL-SAS 盘 则 分 配 到 容量 层 。 存 储 层级 主要 是 用 于 管理 不 同 
性 能 的 存储 介质 ， 以 便 为 不 同性 能 要 求 的 应 用 提供 不 同性 能 的 存储 空间 。 各 存储 层级 的 
区 别 见 表 5-2。 
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表 5-2 存储 层级 的 区 别 
z _ 性能、 价格 、 应 用 


高 性 能 层 性 能 和 价格 较 高 ， 适 合 存放 访问 频率 很 高 的 数据 “ 
性 能 较 高 ， 价 格 适中 ， 适 合 存放 访问 频率 中 等 的 数据 


性 能 较 低 ， 价 格 最 低 且 单 盘 容 量 大 ， 适 合 存放 大 容量 的 






数据 以 及 访问 频率 较 低 的 数据 


3.， 存储 池 

存储 池 〈Storage Pool，SP) 用 于 存放 存储 空间 资源 ， 所 有 应 用 服务 器 使 用 的 存储 
空间 都 来 自 存 储 池 ， 存 储 池 属 于 存储 虚拟 化 范畴 “ 。 一 个 硬盘 域 中 可 以 创建 一 个 或 多 个 
存储 池 ， 不 同 存储 池 之 间 可 实现 故障 和 管理 隔离 ， 分 别 服务 不 同 的 应 用 。 

创建 存储 池 时 ， 可 以 指定 该 存储 池 从 硬盘 域 上 划分 的 存储 层级 类 型 、 对 应 的 RAID 
策略 和 相应 的 存储 容量 。 首 先是 选择 存储 层级 ， 可 以 在 高 性 能 层 、 性 能 层 和 容量 层 中 选 
择 一 个 或 多 个 层级 。 选 择 不 同 的 层级 相当 于 在 SSD 盘 、SAS 盘 、SATA 盘 和 NL-SAS 盘 之 间 
选择 不 同性 能 的 存储 空间 。 层 级 选 定之 后 ， 需 为 所 选 层级 的 存储 资源 指定 容量 并 设置 
RAID 策略 ， 各 个 层级 的 存储 容量 可 以 根据 业务 需求 设 定 ， 同 一 层级 内 部 的 存储 资源 可 以 
按 RAID 1、RAID 10、RAID 3、RAID 5、RAID 50 和 RAID 6 的 RAID 级 别 进 行 组 合 ， 不 同 
RAID 级 别 可 选择 的 RAID 策略 也 有 所 差异 〈 见 表 5-3)。 












表 5-3 RAID 级 别 及 其 策略 
| RAID 级 别 "a a RO A ep 


表 5-3 中 ， 符 号 D 代表 用 户 数据 ，P 代表 校 验 数据 ，nD+mP 代表 ntm 个 磁盘 (逻辑 块 ) 
组 成 一 个 RAID 组 ， 每 个 条 带 上 有 n 个 条 带 单元 用 于 存放 用 户 数 据 ，m 个 条 带 单元 用 于 存放 
校 验 数据 。 例 如 ， 选 择 RAID 3 级 别 时 ， 可 以 选择 两 个 数据 盘 加 一 个 校 验 盘 (2D+1P)、 四 个 
数据 盘 加 一 个 校 验 盘 (4D+1P) 或 八 个 数据 盘 加 一 个 校 验 盘 (8D+1P〉 这 三 种 组 合 方式 。 

4， 磁 盘 组 

磁盘 组 (Disk Group，DG) 指 硬盘 域 中 相同 类 型 磁盘 的 集合 。 磁 盘 类 型 包括 SSD 盘 、 
SAS 盘 、SATA 盘 和 NL-SAS 盘 等 。 根据 硬盘 的 类 型 及 数量 ,存储 系统 会 在 每 个 硬盘 域内 自 
动 划分 出 一 个 或 多 个 磁盘 组 ， 一 个 磁盘 组 中 只 包含 一 种 类 型 的 磁盘 ， 磁 盘 组 属于 系统 内 
部 对 象 ， 主 要 作用 是 故障 隔离 ， 由 存储 系统 自动 完成 配置 ， 对 外 是 透明 的 。 

5. Chunk 

逻辑 块 (Chunk，CK) 是 磁盘 组 中 物理 磁盘 按 固 定 大 小 切 分 成 的 物理 空间 ， 它 是 组 
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成 RAID 的 基本 单位 。 需 要 注意 的 是 ， 轴 辑 块 大 小 是 固定 值 ( 即 64MB 或 256MB)， 不 能 进 
行 更 改 。 通 常 SSD/SAS 盘 被 切 分 成 64MB， 而 SATA/NL-SAS 盘 被 切 分 成 256MB。 

6， 丈 辑 块 组 

逻辑 块 组 (Chunk Group，CKG) 是 指 在 同一 个 磁盘 组 内 的 不 同 磁盘 划分 出 来 的 逻辑 
块 按照 RAID 算法 组 成 的 逻辑 存储 单元 , 其 切 分 组 合 过 程 如 图 5-5 所 示 。 录 辑 块 组 可 视 为 
以 多 个 逻辑 块 为 成 员 盘 组 成 的 一 个 RAID 组 ， 是 存储 池 在 硬盘 域 上 分 配 资源 的 最 小 单位 。 
一 个 逻辑 块 组 中 的 逻辑 块 均 来 自 同一 个 磁盘 组 中 的 物理 磁盘 ， 与 磁盘 组 一 样 ， 逻 辑 块 和 
逻辑 块 组 均 属于 系统 内 部 对 象 ， 由 存储 系统 自动 完成 配置 ， 对 外 是 透明 的 。 
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物理 磁盘 CK 
图 5-5 Chunk 的 切 分 组 合 过 程 


7. Extent 

Extent 是 在 逻辑 块 组 (CKG) 基础 上 划分 的 固定 大 小 的 逻辑 存储 空间 ， 在 创建 存储 
池 时 可 以 设置 大 小 ， 大 小 介 于 512KB 至 64MB 之 间 ， 当 存储 池 创 建 完成 ，Extent 大 小 将 
不 再 更 改 。 不 同 存储 池 的 Extent 大 小 可 以 不 同 ， 但 同一 存储 池 中 的 Extent 大 小 是 统一 
的 。Extent 是 热点 数据 统计 和 迁移 的 最 小 单元 〈 即 数据 迁移 粒度 )， 也 是 存储 池 中 申请 
空间 、 释 放空 间 的 最 小 单位 。 

图 5-6 为 Extent 的 切 分 组 合 过 程 ， 一 个 逻辑 块 组 CKG 可 以 切 分 成 多 个 Extent， 一 
个 Extent 归属 于 一 个 卷 (Volume) 或 一 个 LUN， 多 个 Extent 可 以 组 成 一 个 可 映射 给 主 
机 使 用 的 LUN。 当 LUN 容量 不 够 时 , 可 以 通过 增加 Extent 来 扩大 LUN 容量 , 动态 调整 LUN 
大 小 ， 满 足 业 务 需 求 。 

8. Grain 

Grain 是 一 种 更 细 粒 度 的 Extent。 以 Extent 为 基本 单位 构成 的 LUN 被 称 为 传统 非 
精简 LUN (Thick LUN 或 FAT LUN)， 以 Grain 为 基本 单位 构成 的 LUN 称 为 精简 LUN (Thin 
LUN)。 除 了 组 成 单位 ，Thick LUN 和 Thin LUN 在 存储 空间 分 配 、 存 储 空间 回收 以 及 性 能 
上 也 有 很 大 的 区 别 。 
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5-6 Extent 的 切 分 组 合 过 程 


Grain 是 Extent 在 Thin LUN 模式 下 ， 按 照 64KB 的 固定 大 小 进一步 划分 的 更 细 粒 度 
的 存储 空间 。Thin LUN 模式 中 ， 以 Grain 为 粒度 进行 空间 分 配 并 映射 到 LUN (如 图 5-7 
所 示 )。Grain 内 的 LBA 是 连续 分 布 的 。Grain 是 Thin LUN 的 粒度 单位 。 


LUN (Thin) 





图 5-7 Grain 的 切 分 组 合 过 程 


9. Volume & LUN 

卷 《Volume) 是 存储 系统 内 部 管理 的 对 象 ， 一 个 Volume 对 象 用 于 组 织 同一 个 LUN 
的 所 有 Extent、Grain 罗 辑 存储 单元 ， 可 动态 申请 释放 Extent 来 增加 或 减少 Volume 实 
际 占用 的 空间 。 逻辑 单元 (LUN) 是 可 以 直接 映射 给 主机 进行 读 写 的 存储 单元 , 是 Volume 
对 象 的 外 在 体现 。 
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RAID2. 0+ 通 过 两 层 虚 拟 化 管理 模式 ， 克 服 了 传统 RAID 的 固有 缺点 ， 大 大 提升 了 存 
储 系统 的 可 靠 性 和 资源 管理 的 效率 。 所 谓 两 层 虚 拟 化 是 指 底层 物理 磁盘 的 块 虚拟 化 和 上 
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层 的 LUN 虚拟 化 。 通 过 物理 磁盘 虚拟 池 化 设计 ， 可 以 获得 以 下 优势 ; 

(1) 支持 新 旧 磁 盘 间 自动 负载 均衡 ， 降 低 存储 系统 整体 故障 率 ; 

(2) 支持 故障 磁盘 数据 的 快速 精简 重 构 ， 降 低 数 据 丢 失 的 风险 ; 

(3) 支持 存储 介质 故障 自 检 自 愈 ， 保 证 系统 可 靠 性 ; 

(4) 通过 LUN 虚拟 化 ， 降 低 存储 规划 管理 难度 ; 

(5) 支持 单个 LUN 跨越 多 个 RAID 组 和 多 类 磁盘 ， 实 现 冷 热 数据 自 动 分 层 存储 及 智 
能 迁移 ; 

(6) 支持 存储 空间 的 动态 分 配 回收 ， 灵 活 适应 业务 变化 。 

总 之 ，RAID 2. 0+ 技 术 有 助 于 实现 安全 、 可 信 、 弹 性 、 高 效 的 存储 系统 。 


5.2.1 负载 均衡 


传统 RAID 存储 系统 中 一 般 会 有 多 个 RAID 组 ， 每 个 RAID 组 包含 几 块 到 十 几 块 磁盘 。 
由 于 每 个 RAID 组 的 业务 繁忙 程度 不 同 ， 导 致 磁盘 的 工作 负载 不 均衡 ， 部 分 磁盘 存在 热点 
业务 ， 导 致 其 故障 率 明 显 上 升 。RAID 2. 0+ 技 术 中 ， 数 据 在 存储 池 的 磁盘 上 能 自动 均衡 分 
布 ， 降 低 了 存储 系统 整体 的 故障 率 。 传 统 RAID 技术 与 RAID 2. 0+ 技 术 的 磁盘 负载 情况 如 
图 5-8 所 示 。RAID 2. 0+ 能 更 好 地 支持 数据 负载 均衡 ， 原 因 在 于 RAID 2. 0+ 采 用 了 精细 化 
的 存储 单元 ， 如 Extent、Grain。 
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图 5-8 传统 RAID 与 RAID 2.0+ 的 磁盘 负载 情况 


5.2.2 ”快速 重 构 


随 着 磁盘 技术 的 发 展 ， 单 个 磁盘 容量 的 增长 远 远 快 于 访问 性 能 的 提升 。 容 量 的 增长 
使 传统 RAID 不 得 不 面临 重 构 时 间 增 长 这 一 挑战 。 重 构 一 块 容量 较 小 〈 如 GB 级) 的 磁盘 
可 能 只 需要 几 十 分 钟 ， 而 重 构 一 块 容量 较 大 (如 TB 级 ) 的 磁盘 可 能 需要 十 几 甚至 几 十 个 
小 时 。 单 个 磁盘 容量 越 来 越 大 ， 重 构 时 间 会 越 来 越 长 ， 这 意味 着 出 现 磁盘 故障 时 存储 系 
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统 处 于 降级 状态 的 时 间 越 来 越 长 ， 重 构 期 间 其 他 磁盘 出 现 故 障 的 概率 也 随 之 增加 ， 数 据 
丢失 风险 自然 也 越 来 越 高 。 据 悉 ， 由 于 业务 和 重 构 的 双重 压力 ， 存 储 系统 在 重 构 过 程 中 
发 生 数据 丢失 的 案例 也 屡见不鲜 。 

传统 RAID 技术 中 ， 重 构 时 间 过 长 的 根本 原因 在 于 RAID 组 中 成 员 磁 盘 容 量 过 大 ， 加 
上 成 员 磁 盘 出 现 故 障 时 单个 RAID 组 需要 重 构 的 数据 量 过 大 。 此外, 重 构 生 成 的 大 量 数据 
需要 及 时 写 入 新 盘 或 热 备 盘 中 ， 而 频繁 写 入 数据 的 新 盘 或 热 备 盘 必定 会 出 现 热点 问题 ， 
导致 重 构 过 程 出 现 性 能 瓶颈 。 

RAID2. 0+ 技 术 基于 底层 的 块 级 虚拟 化 技术 ， 实 现 了 多 个 RAID 组 协同 重 构 故障 盘 上 
的 数据 ， 大 大 提升 了 重 构 速度 。 系 统 以 逻辑 块 为 单位 在 多 个 磁盘 中 预 留 热 备 空间 (如 图 
5-9 所 示 )， 克 服 了 传统 RAID 重 构 过 程 中 新 盘 或 热 备 盘 遇 到 的 性 能 瓶颈 问题 ， 使 重 构 数 
据 流 的 写 带宽 不 再 制约 重 构 速度 ， 重 构 性 能 增加 不 仅 降 低 了 双 盘 失效 的 概率 ， 而 且 提 升 
了 存储 系统 的 可 靠 性 。 





图 5-9 传统 RAID 与 RAID 2. 0+ 的 重 构 数 据 存放 情况 


在 传统 RAID 中 ， 假 设 HDD 0、HDD 1、HDD 2、HDD 3 和 了 HDD 4 五 个 磁盘 构成 了 一 个 
RAID 5 组 (如 图 5-10 左 图 所 示 )， 将 HDD 5 设置 为 热 备 盘 ，HDD 6、HDD 7、HDD 8、HDD 
9 属于 其 他 RAID 组 。 当 HDD 1 出 现 故障 时 ， 系 统 将 读 取 HDD 0、HDD 2、HDD 3、HDD 4 
中 的 数据 并 通过 校 验 算法 计算 出 HDD 1 中 的 数据 ,然后 将 重 构 好 的 数据 写 入 热 备 盘 HDD5 
中 。 如 果 写 入 HDD 5 的 数据 量 很 大 ， 受 磁盘 写 吞 吐 率 限制 ， 那 么 写 入 时 间 将 很 长 ， 从 而 
导致 重 构 时 间 将 很 长 。 

RAID 2. 0+ 技 术 中 ， 假 设 系 统 将 HDD 0 至 HDD 9 这 10 个 磁盘 在 逻辑 上 全 部 切 成 一 个 
个 大 小 一 致 的 逻辑 块 CK (如 图 5-10 右 图 所 示 )， 其 中 5 个 CK {CK01、CK12、CK23、CK34 
和 CK45} 组 成 一 个 RAID 5 组 ，CK52、CK13、CK63、CK74 和 CK85 组 成 男 一 个 RAID 5 组 ， 
其 他 CK 以 同样 方式 进行 组 合 ，9 个 RAID 5 组 的 存储 空间 之 和 便 等 于 传统 的 五 盘 RAID 5 
组 的 容量 。 此 时 ， 若 HDD1 出 现 故 障 ， 故 障 盘 HDD 1 中 的 数据 便 以 CK 为 单位 进行 重 构 ， 
分 别 由 包含 了 HDD 1 中 CK 对 应 的 9 个 RAID 5 组 同时 重 构 ， 重 构 好 的 数据 同样 以 CK 为 单 
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位 分 散 存 储 于 多 个 磁盘 中 。 例 如 ，CK12 的 数据 利用 HDD 0、HDD 2、HDD 3 和 HDD 4 这 4 
个 磁盘 进行 重 构 ， 然 后 把 重 构 好 的 数据 存放 到 HDD 9 的 CK96 中 ， 与 此 同时 ，CK13 中 的 
数据 也 利用 HDD 5、HDD 6、HDD 7 和 HDD 8 这 4 个 磁盘 进行 重 构 ， 重 构 好 的 数据 存放 到 
HDD 4 的 CK47 中 。 相 比 传统 RAID 的 多 对 一 重 构 模式 ，RAID 2. 0+ 的 多 对 多 重 构 模 式 有 助 
于 缩短 重 构 时 间 。 此 外 ， 当 系统 中 磁盘 数目 越 多 ，CK 越 分 散 ， 则 RAID 2. 0+ 重 构 的 并 发 
率 将 越 高 ， 重 构 速 度 将 越 高 。 


传统 RAID 重 构 原 理 〔 多 对 一 ) 
HDD 0 HDD 5 
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图 5-10 传统 RAID 与 RAID 2. 0+ 的 重 构 原 理 比 较 


上 述 故 障 处 理 方式 ，RAID 2. 0+ 技 术 能 显著 提升 重 构 速 度 。 在 原 有 坏 道 修 复 和 全 盘 
失效 重 构 两 级 故障 修复 功能 之 间 ，RAID 2. 0+ 增 加 了 数据 块 级 的 故障 修复 功能 ， 能 够 以 逻 
辑 块 CK 为 粒度 只 重 构 已 分 配 并 使 用 了 的 空间 。 当 磁盘 出 现 故障 时 , 通过 对 实际 使 用 空间 
的 有 效 识 别 ， 快 速 重 构 出 失效 数据 ， 进 而 降低 数据 丢失 的 风险 。 


5.2.3 故障 自 检 自 念 


RAID 2. 0+ 技 术 中 ， 存 储 系统 对 磁盘 采用 了 多 重 故障 容错 设计 ， 支 持 磁 盘 在 线 诊断 、 
人 磁盘 故障 分 析 (Disk Health Analyzer，DHA)、 坏 道 后 台 扫 描 、 坏 道 修 复 等 多 种 可 靠 性 
保障 措施 。 此 外 ， 系 统 还 会 根据 热 备 策略 自动 在 存储 池 中 预 留 一 定数 量 的 热 备 空间 ， 用 
户 无 需 进 行 设置 。 当 系统 自动 检测 到 磁盘 上 某 个 区 域 出 现 不 可 修复 的 介质 故障 或 整个 磁 
盘 发 生 故 障 时 ， 将 自动 触发 重 构 操 作 ， 将 故障 介质 上 的 数据 快速 重 构 到 其 他 磁盘 的 热 备 
空间 中 ， 实 现 系统 的 快速 自 愈 合 。 如 图 5-11 所 示 ， 传 统 RAID 需要 单独 设置 热 备 盘 或 等 
待 更 换 新 盘 后 才 触 发 重 构 , 然后 将 重 构 出 的 失效 数据 写 到 热 备 盘 或 新 盘 中 。 在 RAID 2. 0+ 
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中 ， 失 效 数据 可 以 由 多 个 RAID 组 并 行 重 构 ， 并 存放 在 非 故 障 盘 的 热 备 空间 中 。 
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图 5-11 传统 RAID 与 RAID 2. 0 故障 检测 处 理 情况 比较 











5.2.4 ”虚拟 池 化 设计 


目前 主流 的 存储 系统 拥有 成 百 上 千 块 不 同类 型 的 磁盘 ， 如 果 使 用 传统 RAID 技术 ， 
对 于 管理 员 来 说 , 不仅 需 要 管理 数量 众多 的 RAID 组 ,还 需要 针对 每 一 个 应 用 ,周密 地 规 
划 每 一 个 RAID 组 的 性 能 及 容量 。 上 层 应 用 及 业务 发 展 迅 速 , 其 产生 的 数据 的 增长 量 也 快 
速 变 化 ， 因 此 ， 管 理 员 不 得 不 经 常 面临 存储 资源 分 配 不 均等 一 系列 管理 问题 ， 大 大 增加 
了 管理 复杂 度 。 

如 图 5-12 所 示 ， 使 用 RAID2. 0+ 技 术 的 存储 系统 ， 由 于 采用 了 先进 的 两 层 虚拟 化 技 
术 《〈 即 底层 的 块 虚拟 化 和 上 层 的 LUN 虚拟 化 )， 所 有 的 RAID 配置 在 创建 存储 池 时 自动 配 
置 完成 ， 对 存储 资源 进行 池 化 设计 ， 管 理 员 只 需要 维护 少量 的 存储 资源 池 。 同 时 ， 系 统 
会 根据 相应 策略 来 智能 管理 和 调度 系统 资源 ， 大 大 降低 了 存储 规划 和 管理 的 难度 。 
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图 5-12 .RAID 2. 0+ 存 储 系统 规划 管理 
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RAID2..0+ 支 持 更 细 粒 度 〈 可 以 达 儿 十 KB 粒度 ) 的 资源 颗粒 ， 如 Extent、Grain， 在 
此 基础 上 构成 了 一 个 统一 的 存储 资源 池 ， 所 有 应 用 、 中 间 件 、 虚 拟 机 、 操 作 系统 所 需 的 
资源 可 以 在 这 个 资源 池 中 按 需 分 配 及 回收 。 相 对 于 传统 RAID 系统 需要 手工 完成 RAID 组 
创建 、LUN 创建 、LUN 格式 化 等 耗 时 而 容易 出 错 的 操作 ，RAID2. 0+ 技 术 实现 了 存储 资源 的 
虚拟 化 及 预 配置 ， 存 储 资源 的 申请 及 释放 通过 存储 池 可 以 实现 自动 化 ， 降 低 了 存储 管理 
难度 。 


5.2.5 LUN 灵活 组 织 


在 大 型 计算 、 海 量 数据 存储 需求 不 断 涌现 的 年 代 , 随 着 服务 器 计算 能 力 的 不 断 发 展 ， 
数据 库 、 虚 拟 机 等 应 用 越 来 越 多 ， 这 些 应 用 对 存储 系统 的 性 能 、 容 量 、 灵 活性 等 都 提出 
了 更 高 的 要 求 。 传统 RAID 技术 受到 磁盘 数 的 限制 , 性 能 差 且 难以 扩展 ， 已 经 越 来 越 无 法 
满足 业务 的 需求 。 一 方面 , 组 成 一 个 RAID 组 的 磁盘 数 过 少 ; 另 一 方面 , 一 个 LUN 往往 来 
自 一 个 RAID 组 ， 因 此 ， 当 主机 对 一 个 LUN 进行 密集 式 I/0 访问 时 ， 只 能 访问 到 有 限 的 几 
个 磁盘 ， 容 易 导 致 磁盘 访问 瓶颈 ， 出 现 磁 盘 热 点 问题 。 

如 图 5-13 所 示 ， 假 设 LUN 1 与 LUN 2 来 自 同一 个 RAID 组 ，LUN 3 与 LUN 4 分别 来 
自 另外 两 个 RAID 组 。 如 果 主 机 频繁 访问 LUN 1 和 LUN 2， 而 LUN 3 和 LUN 4 处 于 空闲 状 
态 ， 在 传统 RAID 模式 下 ， 这 个 系统 中 LUN 1、LUN 2 所 属 的 5 个 磁盘 通常 处 于 忙碌 状态 
( 即 重负 载 )， 而 LUN 3、LUN 4 所属 的 9 个 磁盘 通常 处 于 空闲 状态 〈 即 轻 负 载 )， 会 造成 
负载 不 均衡 。 如 果 这 14 个 磁盘 能 同时 响应 主机 对 LUN 1 的 频繁 读 写 请 求 ， 那 么 访问 性 能 
将 得 到 很 大 的 提升 。 
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图 5-13 传统 RAID 技术 中 LUN 与 物理 磁盘 的 关系 


RAID2. 0+ 技 术 支 持 由 几 十 甚至 上 百 块 磁盘 组 成 一 个 大 的 存储 资源 池 。LUN 是 基于 存 
储 池 创建 的 , 不 再 受 限 于 RAID 组 的 磁盘 数量 , 单个 LUN 上 的 数据 可 以 分 布 到 相同 类 型 或 
不 同类 型 的 磁盘 上 ， 有 效 避 免 了 磁盘 的 热点 问题 ， 单 个 LUN 在 性 能 和 容量 上 都 得 到 了 大 
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幅 提升 。 

如 图 5-14 所 示 ， 假 设 采用 了 RAID 2. 0+ 技 术 ， 并 在 存储 池 中 划分 出 4 个 LUN， 分 别 
为 LUN 1、LUN 2、LUN 3、LUN 4。 每 个 LUN 中 的 数据 都 遍布 在 系统 的 各 个 磁盘 上 ， 主 机 
在 某 个 时 候 频 繁 访 问 LUN 1、LUN 2、LUN 3 或 LUN 4 中 的 任何 一 个 LUN， 都 可 以 得 到 系 
统 中 14 个 磁盘 的 同时 响应 。 相 比 传统 RAID 模式 只 有 5 个 磁盘 提供 响应 ，RAID 2. 0+ 下 
14 个 磁盘 能 获得 更 高 的 响应 性 能 。 





图 5-14 RAID2. 0+ 技 术 中 LUN 与 物理 磁盘 的 关系 


5.2.6 ”空间 动态 分 布 


传统 RAID 中 ，LUN 在 划分 之 后 就 无 法 增加 容量 ， 如 果 想 增加 容量 ， 抹 掉 LUN 上 所 有 
数据 再 进行 重新 划分 是 一 种 方式 ， 这 个 过 程 复 杂 且 成 本 高 ; 另 一 种 方式 是 采用 LUN 连接 
的 方式 ; 即 重新 创建 LUN, 连接 到 原 LUN, 但 是 操作 步骤 多 ,比较 复杂 。 而 使 用 RAID 2. 0+ 
技术 的 存储 系统 可 以 实现 存储 池 和 LUN 的 动态 扩容 ， 简 单 且 灵 活 ， 当 容量 不 足 时 ， 只 需 
要 简单 地 向 硬盘 域 中 增加 磁盘 就 可 以 完成 存储 池 的 扩容 。 当 LUN 的 规划 容量 无 法 满足 业 
务 需 求 时 ， 可 以 向 存储 池 申 请 增加 Extent 来 扩大 LUN 的 容量 ， 根 据 业 务 需求 动态 调整 
LUN 的 大 小 ， 大 大 提升 了 存储 系统 的 容量 可 扩展 性 和 磁盘 的 空间 利用 率 。 

此 外 ，RAID2. 0+ 采 用 了 业界 领先 的 块 虚拟 化 技术 ， 卷 上 的 数据 和 业务 负荷 会 自动 均 
匀 分 布 到 存储 池 的 物理 磁盘 上 ， 借 助 于 Smart 系列 效率 提升 套件 ， 存 储 系统 自动 根据 业 
务 所 需 的 性 能 、 容 量 、 冷 热 数 据 等 需要 在 后 台 进行 智能 调配 ， 灵 活 地 适应 企业 业务 地 快 
速 变 化 ,下 文 介绍 SmartTier、SmartThinsSmartMotion 和 SmartVirtualization 等 Smart 
系列 效率 提升 套件 。 

如 图 5-15 所 示 ，RAID2. 0+ 支 持 以 下 几 种 空间 管理 功能 。 

智能 数据 分 级 (SmartTier) 指 存储 系统 根据 数据 访问 频率 自动 迁移 数据 。 通 过 1/0 
监控 、 数 据 排 布 分 析 、 数 据 迁 移 三 个 阶段 ，SmartTier 将 活跃 度 高 的 热 数 据 迁 移 至 具有 
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更 高 性 能 的 存储 介质 上 ， 将 活跃 程度 较 低 的 冷 数 据 迁 移 至 具有 更 大 容量 且 成 本 较 低 的 存 
储 介质 上 ， 从 而 实现 在 不 同性 能 层级 之 间 的 数据 迁移 ” 。 分 层 存储 技术 原理 可 参看 本 书 
第 8 章 的 8. 2 小 节 。 






人 二 二 过] Ta 
人 一 一 下 未 分 配 
| | | 但 可 见 
1 
| 虚拟 存储 资源 池 
| Co oO co 
ep a 
SmartTier SmartThin SmartMotion SmartVirtualization 


图 5-15 RAID2. 0+ 技 术 的 智能 功能 


智能 精简 配置 (SmartThin)〉 精细 化 了 存储 空间 的 分 配 粒 度 ， 实 现 LUN 在 线 扩容 和 
空闲 空间 回收 ， 提 高 存储 资源 利用 率 ， 更 大 限度 满足 业务 需求 。 具 体 技术 原理 详 见 本 书 
第 8 章 的 8.1 小 节 。 

智能 数据 迁移 〈SmartMotion) 指 通过 分 析 业 务 情况 ， 将 数据 均衡 分 布 到 同类 存储 
介质 , 维持 容量 和 性 能 动态 均衡 。 以 逻辑 块 CK 为 单位 在 线 实时 地 监控 磁盘 空间 ， 定 时 将 
“繁忙 ”磁盘 上 的 CK 数据 迁移 至 “空闲 ”磁盘 的 CK 上， 实现 磁盘 容量 和 性 能 的 均衡 。 

假设 在 需要 扩容 的 硬盘 域 中 加 入 新 盘 ( 如 图 5-16 所 示 )， 整 个 SmartMotion 数据 均 
衡 过 程 如 下 ,首先 ,需要 在 相应 的 存储 层级 上 查 出 原 盘 中 待 均衡 的 逻辑 块 组 CKG( 原 CKG)。 
如 果 查 出 来 的 CKG 有 一 部 分 没有 数据 ， 则 不 需要 进行 数据 迁移 ， 只 需 改 变 CKG 的 映射 关 
系 ， 用 新 盘 上 的 CK 替换 CKG 中 对 应 位 置 的 原 CK 即 可 。 对 于 有 数据 的 CKG， 则 需要 创建 
目标 CKG 再 进行 数据 迁移 ， 其 中 目标 CKG 应 该 包含 来 自 原 盘 的 空闲 CK 和 新 盘 的 CK， 原 
CKG 和 目标 CKG 对 应 位 置 的 CK 若 不 落 在 同一 盘 上 ， 则 将 此 位 置 上 原 CK 的 数据 迁 到 新 盘 
的 CK《〈 目 标 CK) 上 ， 互 换 原 CK 和 目标 CK 的 映射 关系 ， 原 CKG 中 的 CK 就 被 新 盘 的 CK 
替换 。 此 时 将 被 替换 后 的 目标 CKG 的 CK 释放 了 ,从 而 原 CKG 中 被 替换 到 目标 CKG 中 的 那 
个 CK 的 空间 就 被 释放 了 ， 至 此 便 完成 了 原 盘 上 一 个 CK 的 数据 被 迁移 到 新 盘 上 的 动作 。 

上 述 数 据 迁 移 过 程 中 ， 如 果 原 CKG 和 目标 CKG 对 应 位 置 的 CK 不 止 一 对 落 在 不 同 盘 
上 , 则 会 均衡 不 止 一 个 CK 上 的 数据 。 重复 上 述 动作 , 即 可 实现 磁盘 与 磁盘 间 的 负载 均衡 ， 
结果 如 图 5-17 所 示 。 

异 构 虚 拟 化 (SmartVirtualization) 是 指 本 端 存储 系统 与 异 构 存 储 系统 相互 连接 
后 ， 本 端 存储 系统 能 够 将 异 构 存 储 系统 〈 异 构 存 储 : 在 线 接管 不 同 品牌 厂家 、 各 种 型 号 、 
各 式 接口 的 存储 设备 ， 实 现 跨 设 备 存储 资源 集中 调度 ) 提供 的 存储 资源 当 作 本 地 存储 资 
源 进行 使 用 , 并 对 其 进行 集中 管理 ， 而 无 需 关 注 存储 系统 中 间 件 架构 和 硬件 架构 的 差异 。 
5-18 所 示 为 SmartVirtualization 的 实施 示意 图 。 
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图 5-16 ”SmartMotion 负载 均衡 过 程 


原 盘 2 原 盘 3 





应 用 服务 器 本 端 存储 系统 异 构 存储 系统 
图 5-18 Smartyirtualization 功能 


支持 SmartVirtualization 功能 的 存储 系统 具备 以 下 优势 。 
(1) 良好 的 兼容 性 : 本 端 存储 系统 可 以 兼容 异 构 存储 系统 ， 便 于 集中 规划 和 管理 存 
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储 资源 。 

(2) 占用 存储 空间 少 ， 本 端 存 储 系统 使 用 异 构 存储 系统 外 部 LUN 所 提供 的 存储 空间 
时 ， 并 不 会 做 完整 的 物理 数据 镜像 ， 所 以 不 会 占用 本 端 存储 系统 大 量 的 存储 空间 。 

(3) 优异 的 功能 扩展 : 对 于 外 部 LUN， 本 端 存 储 系统 不 仅 可 以 将 其 当 作 本 地 资源 使 
用 ， 而 且 可 以 设置 远程 复制 、 快 照 等 功能 ， 以 满足 业务 数据 更 高 的 安全 性 需求 。 


5.3 ”本 章 小 结 ER 


本 章 首 先 介 绍 了 RAID 2. 0+ 技 术 发 展 ， 然 后 对 RAID 2. 0+ 技 术 的 基本 概念 、 基 本 原 
理 及 其 应 用 进行 了 阐述 。 具 体 包括 RAID 2. 0+ 双 层 虚 拟 化 技术 (包括 底层 块 虚拟 化 和 上 
层 LUN 虚拟 化 )、 热 备 空 间 策 略 、RAID 2. 0+ 的 软件 架构 、RAID2. 0+ 的 各 软件 逻辑 对 象 ( 包 
插 LD、DD、SP、DG、CK、CKG、Extent、Grain、Volume、LUN) 的 含义 及 关联 联系 、RAID 
2.0+ 的 具体 技术 支撑 (包括 自动 负载 均衡 、 快 速 重 构 、 故 障 自 检 自 愈 、 虚 拟 池 化 设计 、 
LUN 组 织 、 空 间 动 态 分 布 ) 等 方面 。 


练习 题 


一 、 判 断 题 
1. Extent 的 大 小 范围 是 4KB 一 64KB， 默 认为 64KB。( ) 
2. Smart Tier 做 层级 内 的 数据 迁移 ， 实 现 了 数据 的 负载 分 担 。( ) 
3. 硬盘 域 中 的 三 种 类 型 磁盘 SSD 盘 、SAS 盘 和 NL-SAS 盘 分 别 对 应 高 性 能 层 、 性 能 
层 和 容量 层 。( ) 
二 、 选 择 题 
， 以 下 关于 华为 RAID 2. 0+ 技术 中 硬盘 域 的 描述 ， 错 误 的 是 〈 ) 
， 一 个 硬盘 域 是 一 组 硬盘 
. 一 个 硬盘 只 能 属于 一 个 硬盘 域 
. 0ceanStor V3 存储 系统 可 以 创建 一 个 或 多 个 硬盘 域 
.硬盘 域 中 ， 硬 盘 的 类 型 是 相同 的 ， 硬 盘 的 大 小 和 转速 需要 保持 一 致 
.在 华为 RAID 2. 0+ 中 ， 关 于 Chunk 和 Extent 的 描述 正确 的 是 ) 
.Chunk 是 LUN 从 存储 池 中 申请 空间 ， 释 放空 间 的 最 小 单位 
.Extent 是 存储 池 从 硬盘 域 上 分 配 资源 的 最 小 单位 
. Chunk 是 热点 数据 统计 和 迁移 的 最 小 单元 
. 不同 的 存储 池 Extent 大 小 可 以 不 同 ， 但 同一 个 存储 池 中 的 Extent 大 小 是 统一 的 
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三 、 填 空 题 

1. 硬盘 域 中 相同 类 型 的 磁盘 按照 一 定 的 规则 划分 成 〈 )， 各 个 磁盘 的 空间 
被 切 分 成 大 小 一 致 的 CK， 以 来 自 不 同 磁盘 的 CK 为 对 象 ， 按 传统 RAID 技术 的 实现 方 
式 组 成 〈 )， 在 此 基础 上 切 分 固定 大 小 的 Extent， 以 Extent 为 单位 组 成 
( ) 映射 给 主机 。 

2. 划分 存储 层级 时 ，( ) 盘 对 应 到 高 性 能 层 ，( ) 盘 分 配 到 性 能 
层 ,( ) 盘 和 ) 盘 分 配 到 容量 层 。 

四 、 思 考题 


1. 在 RAID 2.0+ 中 ， 创 建 一 个 CKG 时 ， 是 否 只 能 在 一 个 硬盘 上 最 多 取 一 个 CK， 为 
什么 ? 


2. 如 果 存 储 系统 做 RAID 的 硬盘 数 比 较 少 ， 容 量 较 小 ， 做 RAID 1. 0 好 还 是 RAID 2. 0 
好 ? 为 什么 ? 


3. 一 个 磁盘 组 中 是 否 可 以 包含 不 同类 型 磁盘 ? 为 什么 ? 
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6.1 DAS 简 介 
6.2 DAS 技术 特点 
6.3 SCSI 协议 
6.4 本章 小 结 
练习 题 





直接 连接 存储 (Direct Attached Storage，DAS) 是 一 种 将 存储 设备 通过 电缆 直接 
连接 到 主机 服务 器 上 的 一 种 存储 方式 。 数 据 存储 设备 采用 SCSI 或 FC 协议 直接 连接 在 内 
部 总 线 上 ， 构 成 整个 服务 器 结构 的 一 部 分 。 本 章 介 绍 直接 连接 存储 的 相关 内 容 ， 以 及 存 
储 系统 中 基本 而 常用 的 SCSI 协议 。 


>。 了 解 DAS 的 基本 概念 以 及 类 型 ; 
e。 了 解 DAS 的 基本 原理 及 特点 ; 
e。 了解 DAS 的 基本 协议 一 一 SCSI 协议 。 








6.1.1 DAS 基本 概念 


直接 连接 存储 (Direct Attached Storage，DAS) 是 一 种 存储 设备 与 使 用 存储 空间 
的 服务 器 通过 总 线 适 配器 和 SCSI/FC 线 缆 直接 相连 的 技术 。 

在 一 个 典型 的 DAS 架构 中 ， 服 务 器 与 数据 存储 设备 之 间 通 过 总 线 适配器 和 SCSI/FC 
线 缆 直 接连 接 ， 基 于 总 线 传输 数据 ， 中 间 不 经 过 任何 交换 机 、 路 由 器 或 其 他 网 络 设备 ， 
如 图 6-1 所 示 。 挂 接 在 服务 器 上 的 硬盘 、 直 接连 接 到 服务 器 上 的 磁盘 阵列 、 直 接连 接 到 
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服务 器 上 的 磁带 库 、 直 接连 接 到 服务 器 上 的 外 部 便 盘 盒 等 都 属于 DAS 范畴 。 


存储 阵列 设备 虹 


图 6-1 DAS 架构 





存储 阵列 设备 


根据 存储 设备 与 服务 器 间 的 位 置 关 系 的 不 同 ，DAS 分 为 内 部 DAS 和 外 部 DAS 两 类 。 


6.1.2 ”内置 DAS 形态 


内 置 DAS 指 存储 设备 通过 服务 器 机 箱 内 部 的 并 行 总 线 或 串 行 总 线 与 服务 器 相连 接 。 


例如 ， 服 务 器 内 部 连接 硬盘 的 形式 ， 如 图 6-2 所 示 。 

内 置 DAS 有 以 下 几 点 不 是: (1) 采用 服务 器 内 的 物 
理 总 线 连接 ， 受 到 总 线 距离 上 的 限制 ， 只 能 支持 短 距离 
的 数据 传输 ; (2) 内 部 总 线 能 够 连接 的 设备 数目 也 非常 
有 限 ， 不 利于 存储 资源 的 扩展 (3) 因为 存储 设备 位 于 
服务 器 机 箱 内 ， 需 要 对 系统 进行 停机 断 电 ， 用 户 才 能 对 
存储 设备 进行 维护 ; (4) 内 置 DAS 配置 占用 了 机 箱 内 的 
大 量 空间 , 给 服务 器 内 部 其 他 部 件 的 维护 造成 一 定 的 难 
度 ; (5) DAS 无 法 优化 资源 的 使 用 ， 因 为 它 共 享 前 端 端 
口 的 能 力 有 限 ， 使 得 资源 共享 受 限 。 





图 6-2 内 置 DAS 存储 形态 


内 置 DAS 的 管理 主要 是 通过 主机 和 主机 操作 系统 来 实现 ， 也 有 使 用 第 三 方 软件 来 进 
行 管理 。 主 机 主要 实现 存储 设备 硬盘 / 卷 的 分 区 创建 及 分 区 管理 , 以 及 操作 系统 支持 的 广 


件 系统 布局 。 
6.1.3 外 置 DAS 形态 


外 置 DAS 中 ， 服 务 器 与 外 部 存储 设备 基于 总 线 直 接连 接 ， 通 过 FC 协议 或 者 SCSI 协 


议 进行 通信 。 例 如 直接 连接 到 服务 器 的 外 部 硬盘 阵列 。 


相 比 内 置 DAS， 外 置 DAS 克服 了 内 部 DAS 对 连接 设备 的 距离 和 数量 的 限制 ， 可 以 提 
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供 更 远 距 离 、 更 多 设备 数量 的 连接 ， 增 强 了 存储 扩展 性 。 另 外 ， 外 部 DAS 还 可 以 提供 存 
储 设 备 集中 化 管理 ， 使 操作 维护 更 加 方便 。 但 是 ， 外 置 DAS 对 设备 连接 距离 和 数量 依然 
存在 限制 ， 也 存在 资源 共享 不 便 的 问题 。 

相对 于 内 置 DAS 的 管理 ， 外 置 DAS 管理 的 一 个 关键 点 是 主机 操作 系统 不 再 直接 负责 
一 些 基础 资源 的 管理 ， 而 是 采用 基于 阵列 的 管理 方式 ， 比 如 LUN 的 创建 、 文 件 系统 的 布 
局 以 及 数据 的 寻 址 等 。 如 果 主 机 的 内 部 DAS 是 来 自 多 个 厂商 的 存储 设备 ， 如 硬盘 ， 则 需 
要 对 这 些 存 储 设 备 分 别 进行 管理 。 但 是 ， 如 果 将 这 些 存储 设备 统一 放 到 某 个 厂商 的 存储 
阵列 中 ， 则 可 以 由 阵列 的 管理 软件 进行 集中 化 统一 管理 。 这 种 操作 方式 避免 了 主机 操作 
系统 对 每 种 设备 的 单独 管理 ， 维 护 管理 更 加 便捷 。 

如 图 6-3 所 示 ， 外 置 DAS 包含 两 种 存储 形态 : 外 部 硬盘 阵列 和 智能 硬盘 阵列 。 

外 部 硬盘 阵列 (DAS) 智能 硬盘 阵列 DAS) 


Server Server 


SCSI 卡 


J 


JBOD 磁盘 阵列 
图 6-3 外 置 DAS 存储 形态 

磁盘 簇 (Just a Bunch 0f Disks，JB0D)〉 即 为 外 部 磁盘 阵列 ，JB0D 技术 在 逻辑 上 
把 几 个 物理 磁盘 串联 在 一 起 ,解决 内 置 存储 的 磁盘 槽 位 有 限 而 导致 的 容量 扩展 不 足 问 题 。 
其 目的 仅仅 是 为 了 增加 磁盘 的 容量 ， 并 不 提供 数据 安全 保障 。JB0D 采用 单 磁盘 存放 方式 
来 保存 数据 ， 可 靠 性 较 差 。 

智能 硬盘 阵列 由 控制 器 和 硬盘 构成 。 其 中 控制 器 中 包含 RAID 功能 、 大 容量 Cache， 
使 得 磁盘 阵列 具有 多 种 实用 的 功能 ， 如 增强 数据 容错 性 、 提 升 数 据 访问 性 能 等 。 智 能 硬 
盘 阵 列 通常 采用 专用 管理 软件 进行 配置 管理 。 








DAS 适用 于 对 存储 容量 要 求 不 高 、 服 务 器 数量 很 少 的 中 小 型 局 域 网 ， 其 主要 优点 在 


i 


第 6 章 DAS 技术 介绍 


于 存储 容量 扩展 的 操作 非常 简单 ， 投 入 的 成 本 少 。 下 面 分 述 DAS 技术 的 优 缺 点 。 

1. DAS 的 优点 

(1) 本 地 数据 供给 优势 明显 ; 

(2) 系统 可 靠 性 高 ; 

(3) 针对 小 型 环境 部 署 简 单 ; 

(4) 系统 复杂 度 较 低 ; 

(5) 成 本 少 而 见效 快 ， 系 统 效益 高 。 

2. DAS 的 局 限 性 

DAS 存储 方式 实现 了 机 内 存储 到 存储 子 系统 的 跨越 ， 但 其 也 存在 很 多 局 限 性 : 

(1) 扩展 性 差 QD 规模 扩展 性 。 服 务 器 与 存储 设备 之 间 采 用 SCSI 线 缆 直 接连 接 的 
方式 ， 提 供 的 有 效用 户 接口 数量 通常 较 少 ， 导 致 了 主机 数目 和 可 以 连接 的 存储 上 双向 受 
限 ， 当 整个 系统 新 增 应 用 服务 器 时 ， 必 须 为 新 增 服务 器 单独 配置 存储 设备 ， 造 成 用 户 投 
资 的 浪费 和 重复 ，@ 性 能 扩展 性 。DAS 设备 的 带宽 有 限 ， 这 也 导致 了 其 处 理 1/0 的 能 力 
有 限 ， 当 与 DAS 设备 相连 的 主机 对 I/0 性 能 的 需求 较 大 ， 很 快 就 达到 DAS 设备 的 1/0 处 
理 能 力 上 限 。 

(2) 浪费 资源 : 存储 空间 无 法 充分 利用 ， 存 在 浪费 ， 因 为 DAS 共享 前 端 主机 端口 的 
E 力 有 限 ， 也 导致 了 DAS 的 资源 利用 率 比 较 低 。DAS 系统 容易 出 现存 储 资源 孤岛 现象 ， 
即 ， 有 些 DAS 系统 资源 过 剩 ， 而 有 些 DAS 系统 资源 紧张 ， 原 因 在 于 系统 很 难 将 剩余 未 用 
的 存储 资源 重新 进行 分 配 ， 从 而 阻碍 了 DAS 设备 之 间 的 资源 共享 。 

(3) 管理 分 散 : DAS 方式 的 数据 存储 依然 是 分 散 的 ， 不 同 的 应 用 各 有 一 套 存 储 设备 ， 
难以 对 所 有 存储 设备 进行 集中 统一 管理 。 

(4) 异 构 化 严重 : DAS 方式 使 得 企业 在 不 同 阶段 采购 了 不 同 厂 商 不 同型 号 的 存储 设 
备 ， 设 备 之 间 异 构 化 现象 严重 ， 导 致 维护 成 本 居 高 不 下 。 

(5) 数据 备份 问题 : DAS 方式 与 主机 直接 连接 ， 在 对 重要 的 数据 进行 备份 时 ， 将 会 
极 大 地 占用 主机 网 络 的 带宽 。 

(6) 维护 内 置 DAS 时 ， 系 统 需要 停机 断 电 处 理 。 





人 6.3 SCSI 


6.3.1 SCSI 协议 概览 


1。 总 线 
总 线 (Bus) 是 计算 机 与 存储 系统 间 进 行 数 据 通信 的 主要 通道 ， 是 源 设备 到 目标 设 
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备 的 数据 传输 路 径 。 

在 数据 通信 过 程 中 ， 控 制 器 首先 向 总 线 处 理 器 发 出 请 求 信号 ， 请 求 使 用 总 线 ， 该 请 求 
被 接受 后 ， 控 制 器 高 速 缓存 开始 进行 数据 的 发 送 。 整 个 过 程 中 , 控制 器 占用 总 线 ， 总 线 上 连 
接 的 其 它 设 备 都 无 法 占用 总 线 。 但 是 ， 总 线 具 备 有 中 断 功 能 ， 因 此 总 线 处 理 器 可 以 随时 中 断 
传输 过 程 并 且 将 总 线 控制 权 转 交 给 其 他 设备 ， 以 便 其 他 拥有 更 高 优先 级 的 设备 执行 操作 。 

例如 ,将 移动 手机 或 数码 相机 连接 到 计算 机 时 , 一 般 使 用 通用 串 行 总 线 (Universal 
Serial Bus，USB) 端口 。 对 于 存储 音频 文件 、 图 元 文件 等 的 小 型 电子 设备 ， 例 如 MP3 
或 移动 手机 ，USB 端口 已 经 可 以 满足 传输 数据 和 充电 的 工作 。 然 而 ，USB 串 行 总 线 并 不 足 
以 同时 支持 整 台 计算 机 和 服务 器 以 及 其 他 多 台 设 备 的 数据 传输 使 用 。 在 这 种 情况 下 ， 计 
算 机 就 需要 使 用 SCSI 这 种 并 行 总 线 。 

小 型 计算 机 系统 接口 (Small Computer System Interface，SCST) 是 一 种 用 于 计 
算 机 及 其 周边 设备 之 间 ( 硬 盘 、 软 驱 、 光 驱 、 打 印 机 、 扫 描 仪 等 ) 系统 级 接口 的 独立 处 
理 器 标准 。 如 图 6-4 所 示 ，SCSI 总 线 上 数据 操作 和 管理 是 由 SCSI 控制 器 控制 ，SCSTI 控 
制 器 可 以 看 成 是 一 块 小 型 CPU， 它 有 自己 的 命令 集 和 缓存 空间 。SCSI 总 线 结构 可 以 对 计 
算 机 中 连接 到 SCSI 总 线 上 的 多 个 设备 进行 动态 分 工 操作 , 并 可 以 对 系统 中 的 多 个 工作 灵 
活 地 进行 资源 分 配 ， 动 态 完 所 


SCSI 总 线 





主机 适配器 
SCSIID7 


图 6-4 SCSI 总 线 模型 


2. SCSI 协议 

SCSI 协议 全 称 是 小 型 计算 机 系统 接口 协议 ， 是 主机 与 存储 磁盘 通信 的 基本 协议 ， 也 
是 计算 机 和 外 围 存储 设备 之 间 进 行 数 据 传输 的 通用 接口 标准 ， 支 持 并 行 传输 数据 ””。 

SCSI 协议 除了 被 DAS 用 于 实现 主机 服务 器 与 存储 设备 的 互联 , 也 是 SAN 网 络 传输 的 
基本 协议 ， 承 载 在 FC 协议 和 iSCSI 协议 中 进行 传输 (具体 内 容 可 参看 本 书 第 7 章 )。 

3. 并 行 SCSI 的 演变 

SCSI 协议 最 初 由 Shugart Associates 和 NCR 公司 在 1981 年 开发 出 来 ， 并 命名 为 SASI 
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(Shugart Associates System Interface )。 两 家 公司 开发 SASI 的 目的 是 建立 一 个 专用 
的 、 高 性 能 的 系统 接口 标准 ， 后 来 ， 为 了 增加 SASI 在 行业 的 接受 度 ， 将 SASI 协议 更 新 
升级 成 了 一 个 更 强大 的 接口 协议 ， 并 更 名 为 SCSI 。1986 年 ， 美 国 国 家 标准 委员 会 
(American National Standards Institute，ANSI) 认可 SCSI 作为 行业 标准 。SCSI 经 
历 了 SCSI-1、SCSI-2、SCSI-3 的 演变 过 程 ， 如 表 6-1 所 示 。 
表 6-1 SCSI 版 本 演变 
版 本 信息 主 频 总 线 宽度 传输 速率 ”| 可 连接 设备 数 
EE (MHz) (bit/s) (MB/s)- | 不 含 接口 卡 ) 
SS | 5 | 8 5 * 
Fast SCSI i0 | 8 | 
Wide SCSI 10 16 


Ultra SCSI (Fast-20) 20 
Ultra Wide SCSI 2 














Ultra2 SCSI 40 
Ultral60 SCSI 160 
Ultra320 SCSI 
Ultra640 SCSI 


8 20 
16 40 
8 40 
16 40 




















SCSI-1 是 最 初 的 SCSI 标准 。SCSI-1 又 称 为 Narrow SCST， 它 定义 了 线 缆 长 度 ， 信 
号 特性 ， 命 令 和 传输 模式 。 其 支持 的 最 大 数据 传输 率 为 5MB/s， 使 用 8 位 罕 总 线 ， 最 大 
支持 接 入 7 个 设备 。SCSI-1 是 在 1986 年 开发 的 原始 规范 ， 现 已 不 再 使 用 。 

SCST-2 标准 是 1992 年 制定 的 ，SCSI-2 是 SCSI-1 的 发 展 ， 在 SCSI-1 标准 中 加 入 一 
些 新 功能 。SCSI-2 提供 了 两 种 传输 选择 : 一 种 为 Fast SCST， 同步 传输 速率 可 达 10MB/s; 
另 一 种 是 Wide SCSTI， 最 大 同步 传输 速度 为 20MB/s， 并 且 由 8 位 罕 总 线 扩展 到 16 位 ， 最 
大 支持 接 入 15 个 设备 。 

SCSI-3 是 SCSI 最 新 版 本 ， 也 称 为 Ultra SCSI， 由 多 个 相关 的 标准 组 成 。SCSI-3 最 
大 支持 15 个 设备 的 接 入 ， 最 大 传输 速率 可 达 640MB/s， 同 时 ，SCSI-3 大 大 地 提高 了 总 线 
频率 ， 降 低 了 信号 干扰 ， 增 强 了 数据 传输 的 稳定 性 。 


6.3.2 SCSI| 通信 过 程 


从 本 质 上 讲 ，SCSI 是 一 个 智能 传输 协议 。 多 个 设备 连接 到 同一 组 总 线 上 的 并 行 通信 
通道 ， 这 些 设备 可 以 相互 进行 通信 。 也 就 是 说 ， 两 个 连 在 同一 组 总 线 上 的 设备 可 以 互相 
通信 ， 不 需要 CPU 或 者 特别 的 适 配 卡 协助 。 

1. SCSI 协议 传输 过 程 

SCSI 协议 在 传输 过 程 中 经 历 以 下 5 个 阶段 : 

(1) 总 线 忙 : 在 总 线 通 信 开 始 之 前 ， 总 线 必 须 处 于 室 闲 状态 。 发 起 连接 的 设备 〈 启 
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动 器 ) 首先 会 发 一 个 测试 信号 来 确认 总 线 是 否 空闲 ; 

(2) 寻 址 : 通过 发 送 方 的 地 址 和 接收 方 的 地 址 来 确认 通信 的 双方 ; 

(3) 协商 : 通信 双方 协商 确定 后 面 数据 包 的 大 小 和 数据 包 发 送 的 速度 ; 

(4) 连接 : 数据 包 传输 阶段 ; 

(5) 断 开 连 接 : 数据 传输 完成 ， 释 放 总 线 。 

一 旦 启动 器 监测 到 总 线 处 于 空闲 状态 ， 则 该 启动 器 设备 就 获得 了 该 总 线 的 传输 数据 
专 有 权 ， 从 而 占有 总 线 。 然后， 启动 器 通过 寻 址 来 确定 目标 器 设备 。 由 于 SCSI 协议 拥有 
多 个 版 本 ， 不 同 版 本 在 数据 包 发 包 速度 和 支持 的 设备 地 址 位 数 等 方面 存在 不 同 ， 因 此 需 
要 两 个 设备 之 间 事 先 协商 好 通信 参数 ,协商 内 容 包括 数据 包 发 包 的 速度 和 地 址 的 位 数 等 。 
尽管 这 种 协商 过 程 比较 耗 时 ， 但 只 有 协商 成 功 之 后 ， 启 动 器 和 目标 器 设备 才能 够 进行 真 
正 的 数据 内 容 传输 。 

两 个 SCSI 设备 的 每 次 连接 通信 都 要 经 历 以 上 5 个 阶段 。 由 于 协商 阶段 的 时 间 较 长 ， 
影响 了 整体 的 传输 效率 ， 但 是 协商 阶段 是 必需 的 ， 只 有 协商 成 功 之 后 ， 启 动 器 和 目标 器 
设备 才能 进行 数据 传输 。 为 了 保障 传输 性 能 又 能 保证 通信 连接 ， 现 在 介绍 一 种 断 开 重 连 
技术 。 

断 开 重 连 技 术 有 助 于 缩短 设备 通信 连接 时 间 。 采用 断 开 重 连 技术 时 ， 只 有 在 第 一 
次 连接 时 需要 执行 “总 线 忙 一 寻 址 一 协商 一 连接 一 断 开 连 接 ” 这 五 个 步骤 ,之 后 当 同 
一 个 启动 器 跟 同 一 个 目标 器 进行 通信 数据 传输 时 ， 可 以 直接 省 略 协商 这 一 步骤 ,这 是 
由 于 双方 之 前 在 建立 通信 时 已 经 协商 好 相关 参数 , 因此 再 次 连接 时 可 以 使 用 上 一 次 协 
商 结果 。 

为 了 提升 整体 性 能 效率 ，SCSI 还 引入 标签 指令 队列 技术 ， 其 工作 方式 如 下 : 启动 器 
设备 在 发 送 数据 时 一 次 发 送 多 个 SCSI 数据 包 , 目标 器 设备 收 到 这 些 数据 包 后 进行 内 部 处 
理 ， 然 后 再 将 数据 包 的 内 容 写 到 相应 的 物理 存储 介质 中 。 当 目标 器 设备 接收 到 数据 包 并 
缓存 到 内 部 存储 之 后 ， 立 即 释放 其 对 总 线 的 使 用 权 ， 便 于 其 他 设备 可 以 使 用 总 线 。 利 用 
标签 指令 队列 技术 , 既 可 以 减少 设备 间 建 立 连接 的 次 数 , 也 可 以 减少 对 总 线 的 占用 次 数 ， 
增加 了 总 线 的 整体 利用 率 。 

2. SCSI 数据 传输 原理 

以 图 6-5 为 例 来 描述 SCSI 协议 中 数据 传输 原理 ， 有 具体 如 下 : 

(1) 当 设备 B 要 向 设备 D 传输 数据 时 ， 数 据 的 发 起 端 〈 即 ， 设 备 B) 以 电信 和 号 的 方 
式 将 数据 发 送出 去 ， 数 据 从 设备 B 与 总 线 的 接 入 点 发 送 到 总 线 上 ; 

(2) 信和 号 到 达 总 线 上 的 交叉 点 后 被 分 成 两 份 ， 分 别 朝 分 叉 的 两 个 方向 继续 传输 ， 并 
且 在 每 个 交叉 口 分 份 ， 再 沿 着 各 个 分 叉 的 方向 进行 传输 。 因 此 ， 当 承载 着 数据 的 电信 和 号 
从 设备 B 传输 到 设备 B 与 总 线 的 交叉 点 后 ， 信 和 号 将 分 成 两 份 ， 分 别 向 总 线 的 两 个 相反 的 
方向 进行 传输 。 当 信号 到 达 设备 A 或 设备 C 与 总 线 的 交叉 点 时 ， 信 号 再 次 会 分 成 两 份 ， 
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分 别 治 着 总 线 方向 和 设备 方向 进行 传输 。 当 信和 号 到 达 设 备 D 与 总 线 的 交叉 点 时 ， 也 会 以 
同样 的 方式 进行 传输 ; 

(3) 当 设 备 D 收 到 信号 时 ， 其 中 一 份 信号 向 设备 D 传输 ， 另 一 方 则 继续 向 前 传输 到 
达 总 线 的 尽头 。 在 传输 的 信号 里 ， 包 含 了 数据 包 目 标 设备 等 信息 。 因 此 ， 当 设备 A 和 设 
备 C 接收 到 这 个 数据 包 后 ， 发 现 这 个 数据 包 不 是 传输 给 它们 的 ， 数 据 包 将 被 丢弃 。 而 设 
备 D 发现 这 个 数据 包 是 传输 给 自己 的 ， 就 会 接收 并 处 理 这 个 数据 包 的 数据 ， 

(4) 除了 设备 D 收 到 的 数据 包 ， 还 有 一 份 数据 继续 往 下 传输 并 到 达 总 线 的 尽头 。 为 
了 避免 信号 被 反射 回 总 线 ， 需 要 在 总 线 的 尽头 安装 一 个 终结 器 以 吸收 信号。 


蓝 装 改 





图 6-5 SCSI 传输 原理 


终结 器 位 于 SCSI 总 线 的 尽头 ， 用 于 吸收 接收 到 的 信号 以 防止 反射 ， 减 小 信和 号 相互 
影响 ， 维 持 SCSI 总 线 上 的 电 平 稳定 。 因 此 ， 每 一 个 SCSI 总 线 系统 都 需要 安装 终结 器 ， 
以 保证 正常 得 进行 信号 传输 。 

另外 ， 在 传输 过 程 中 会 有 一 份 信号 传输 到 总 线 的 另 一 端 ， 即 SCSI 适 配 卡 端 ， 与 终 
结 器 一 样 ， 传 输 到 这 一 端的 信号 同样 也 会 被 吸收 ， 防 止 信号 被 反射 回去 。 

3. SCSI 数据 传输 方式 

SCSI 通信 传输 方式 有 两 种 :异步 方式 和 同步 方式 。 

异步 传输 方式 下 ， 两 组 数据 传输 之 间 没 有 固定 的 时 间 间 隔 。SCSI 协议 发 送 额外 的 信 
息 或 者 命令 来 发 起 通信 。 比 如 ， 在 发 送 内 容 数据 前 ， 首 先 由 发 起 方 先 发 送 状态 信息 ， 接 
收 方 根据 状态 信息 获悉 马上 要 发 送 内容 数 据 。 额 外 状态 信息 或 者 命令 的 发 送 时 间 可 以 不 
是 固定 的 ， 因 此 ， 内 容 数据 之 间 的 传输 间隔 也 可 以 不 是 固定 的 。 这 是 异步 传输 方式 的 重 
要 特点 。 

同步 传输 方式 下 ， 数 据 包 会 按照 定时 器 设 定 的 时 间 间 隔 进行 传输 。 首 先 ， 通 信 双 方 
先 通过 异步 方式 来 确定 对 方 设 备 是 否 已 经 准备 好 接收 数据 ;建立 连接 之 后 ， 通 信 双 方 会 
采用 最 高 效 的 传输 方式 进行 实际 内 容 数据 的 传输 ， 这 种 方式 就 是 同步 传输 方式 。 在 同步 
传输 方式 中 ， 发 起 方 发 送 数据 的 时 间 间 隔 是 固定 的 ， 而 接收 方 知道 这 个 时 间 间 隔 ， 就 能 
快速 地 接收 和 处 理 数据 。 

4 SCSI ID : 

在 SCSI 总 线 体系 结构 中 ， 任 何 连接 到 总 线 的 设备 都 可 以 互相 通信 。 为 实现 这 一 点 ， 
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信和 号 从 发 送 端 设备 发 出 后 ， 最 终 会 在 多 点 总 线 〈 多 分 支 总 线 ) 上 结束 。 在 多 点 总 线 上 ， 
信号 将 被 传输 到 目标 设备 上 。 在 这 个 通信 流程 中 ， 需 要 保证 总 线 上 的 多 个 并 发 用 户 不 会 
互相 干扰 。 如 果 总 线 上 多 个 设备 同时 发 送信 息 就 会 产生 线路 拥塞 ， 发 生 线 路 拥塞 时 ， 多 
个 设备 发 送 的 信息 之 间 会 互相 冲突 、 和 干扰 ， 最 终 导致 所 有 设备 的 发 送 操作 都 不 成 功 ， 而 
发 送 端 必须 重新 进行 发 送 ， 这 就 导致 数据 的 发 送 效 率 变 低 ， 因 此 需要 保证 连接 到 总 线 上 
的 多 个 设备 不 会 同时 发 送信 息 。 

为 了 保证 SCSI 总 线 系统 同一 时 刻 在 整 条 总 线 上 只 有 一 个 设备 在 发 送信 息 ， 开 发 者 
们 设计 出 了 一 种 带 优先 级 的 等 候 机 制 ， 即 ， 总 线 上 的 每 个 SCSI 设备 都 有 不 同 的 优先 级 。 
SCSI ID 用 于 唯一 标识 总 线 上 的 设备 ， 即 标识 着 数据 的 发 送 方 和 接收 方 ， 这 里 采用 设备 
的 SCSI ID 来 标记 设备 的 优先 级 ， 用 于 决定 每 个 设备 在 检测 到 总 线 忙 时 需要 等 待 多 久 再 
尝试 发 送 数 据 。 

如 果 是 8 位 窗 线 ， 则 优先 级 从 高 到 低 为 : 7 > 6 > 5>4>3>2>1>0。 

如 果 是 16 位 罕 线 ， 则 优先 级 从 高 到 低 为 : 7 >6>5>4>3>2>1>0>15> 
二 DD 

无 论 是 8 位 窗 线 还 是 16 位 窗 线 ， 能 连接 的 设备 数 都 是 n-1 (n 表示 总 线 宽度 )， 其 
中 一 位 被 SCSI 控制 器 占用 。 由 于 控制 器 需要 控制 整 条 总 线 ,， 因 此 控制 器 的 优先 级 必须 是 
最 高 的 7。 

当 一 个 设备 需要 发 送 数据 时 ， 它 必须 要 检测 总 线 是 否 在 忙 ， 即 是 否 有 另外 一 个 设备 
正在 发 送 数据 。 当 设备 检测 到 总 线 在 忙 (如 ， 有 其 它 设备 正在 发 送 数据 )， 它 就 需要 等 待 
一 定 的 时 间 再 尝试 发 送 。 这 个 等 待 的 时 间 长 短 是 由 其 SCSI ID 决定 的 。 设 备 的 优先 级 越 
高 ， 则 它 等 待 的 时 间 就 越 少 ， 因 而 ， 在 等 待 时 间 结 束 后 ， 能 够 成 功 发 送 数 据 的 概率 就 越 
大 。 通 常 来 说 ， 总 线 上 的 设备 中 ， 速 度 快 的 设备 (如 硬盘 ) 比 速度 慢 的 设备 (如 磁带 库 ) 
拥有 更 高 的 优先 级 。 

5. SCSI 协议 寻 址 

在 SCSI 总 线 的 通信 过 程 中 ， 除 了 保证 总 线 上 的 多 个 并 发 用 户 不 会 互相 干扰 之 外 ， 
还 要 组 织 通 信 流 程 ， 以 保证 数据 最 终 到 达 总 线 上 正确 的 目标 设备 。 借 助 SCSI 寻 址 ， 将 
信息 准确 无 误 地 发 送 到 正确 的 目标 设备 上 。 上 文 提 过 ，SCSI ID 用 于 唯一 标志 总 线 上 的 
设备 ， 但 是 ， 仅 仅 依靠 SCSI ID 是 不 能 寻找 到 目标 设备 的 。 如 图 6-6 所 示 ，SCSI 总 线 
的 寻 址 过 程 是 通过 总 线 号 (Bus ID) 一 设备 号 (SCSI ID) 一 逻辑 单元 号 (LUN ID) 来 
实现 的 。 | 

总 线 号 (BUS ID) 用 于 区 分 每 一 条 总 线 。 传 统 的 SCSI 适 配 卡 连接 单个 总 线 ， 相 应 
地 ， 只 有 一 个 总 线 号 。 一 个 服务 器 可 能 配置 了 多 个 SCSI 控制 器 ， 从 而 可 能 有 多 条 SCSI 
总 线 。 

设备 号 (SCSI ID) 用 于 识别 某 SCSI 总 线 上 的 每 一 个 存储 设备 ， 每 条 总 线 最 多 可 允 
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许 有 8 个 或 者 16 个 设备 ID。 服 务 器 中 的 主机 总 线 适 配器 也 拥有 独立 设备 ID。 
罗 辑 单元 号 (LUN ID) 用 于 识别 某 存 储 设 备 上 的 每 一 个 子 设 备 。 子 设备 包括 虚拟 磁 
盘 、 磁 带 驱动 器 和 介质 更 换 器 等 。 利 用 逻辑 单元 号 ， 可 以 对 存储 设备 中 的 子 设 备 进行 


时 此 

总 线 号 | 区 分 不 同 的 SCSI 总 线 

SO 区 分 SCST 总 线 上 不 同 的 设备 
区 分 SCSI 设备 中 的 子 设备 





SN 


图 6-6 SCSI 协议 寻 址 内 容 





下 面 介绍 一 下 查看 SCSI ID 的 方法 : 

(1) 在 Windows 中 查询 SCSI ID 

在 “我 的 电脑 ”上 单 击 鼠标 右键 ， 然 后 从 快捷 菜单 中 选择 “管理 ”， 在 计算 机 管理 
窗口 中 , 单 击 导航 树 中 的 “磁盘 管理 ” 右键 单 击 映射 的 磁盘 , 然后 从 快捷 菜单 中 选择 “ 属 
性 ”， 在 “常规 ”选项 卡 页 面 中 可 以 查看 当前 位 置 的 SCSI 设备 ID 信息 ， 如 图 6-7 所 示 。 











HUAWEI S5500T 





SCSI Disk Device Properties 

General | Palicies | Volumes| Driver | 

< HUAWEI S5500T SCSIDisk Device 
Devicelype:. Disk dives 


Manufacturer: [Standard disk diives] 
Localion' Bus Number 0 Target ld DJLUN 0 





图 6-7 在 Windows 中 查询 SCST ID 


可 以 看 到 ，BUS Number、Target ID 和 LUN ID 都 为 0， 其 中 Target ID 即 为 SCSI ID。 
这 里 的 “Target” 通 常用 于 表示 该 目标 设备 的 数据 物理 存储 位 置 。“Target” 通常 是 一 
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个 物理 硬 稚 ， 而 在 企业 级 服务 器 中 , “Target” 对 应 着 更 复杂 的 存储 系统 ， 如 磁盘 阵列 、 
磁带 库 等 。 

(2) 在 Linux 系统 查看 SCSI ID 

在 Linux 系统 的 命令 行 中 ， 输 入 命令 lsscsi， 结 果 如 图 6-8 所 示 。 


cy: yp oc /aes 二 lsscsi 
T ST3160318AS CC65 /dev/sda 
elyGvd HL-DT-ST DVD-ROM DH1ON OM10 /dev/sr0 
disk HUAWEI 55500T 2105 /dev/sdb 


图 6-8 在 Linux 中 查询 SCSI ID 





主机 上 每 个 SCSI 设备 都 具有 一 个 SCSI 地 址 ， 该 地 址 由 initiator ID (或 称 为 host 
ID)、bus ID、target ID 以 及 LUN ID 组 成 ; 在 实际 组 网 中 ，initiator ID 一 般 对 应 主 
机 HBA 端口 ，target ID 一 般 对 应 存储 阵列 控制 器 端口 (bus ID 适用 于 老 旧 的 并 行 SCSI 
总 线 ， 在 SAN 环境 中 一 般 固 定 为 0)。 


6.3.3 ” SCSI 协议 模型 


SCSI-3 协议 架构 是 由 ANSI 认可 和 发 布 的 X. 3. 270-1996 号 标准 ,可 以 帮助 开发 人 员 、 
硬件 设计 人 员 和 用 户 更 有 效 地 理解 和 使 用 SCSI。 在 SCSI-3 架构 中 ， 定 义 和 分 类 了 各 种 
SCSI-3 标准 和 要 求 。 如 图 6-9 所 示 ，SCSI 架构 模型 主要 有 以 下 组 成 部 分 : 

(1) 命令 层 ， 也 称 为 应 用 层 。 它 包括 了 适用 于 所 有 设备 的 通用 指令 和 某 一 指定 类 型 
的 设备 专用 的 初级 指令 。 

(2) 传输 层 : 定义 了 设备 间 互 连 和 信息 共享 的 标准 规则 ， 保 障 计算 机 生成 的 SCSI 
指令 都 能 够 成 功 的 传送 到 目标 端 。 

(3) 物理 层 : 也 称 为 互 连 层 ， 定 义 了 如 电信 号 传输 方法 和 数据 传输 模式 之 类 的 接口 


Er em 


'@ 


四 
VY 
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i FT Se ER I 
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| tt 


图 6-9 SCSI 协议 架构 
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6.3.4 ”SCSI 读 写 操作 过 程 


SCSI 采用 客户 端 /服务 器 (Client/Server，C/S) 模型 进行 通信 。 主 机 /启动 器 到 存 
储 磁盘 /目标 器 的 通信 由 启动 器 发 起 ， 由 目标 器 接收 和 处 理 。 当 发 起 端 和 目标 端 建立 起 
连接 后 ， 一 个 I/0 请 求 通常 由 主机 上 的 应 用 程序 或 系统 发 出 ， 由 目标 端的 存储 设备 接 
收 处 理 。 

如 图 6-10 所 示 ， 当 进行 SCSI 读 写 操作 时 : 


IO 
主机 /启动 器 ~" ee 吕 存储 磁盘 /目标 器 
CAS 
SCSI 应 用 层 scsi 应 用 。 | 中 eee 中 SCSI 应 用 层 


Pe 数据 
SCSI we SCSI 用 
人 


| 10 SCSI Ne 


在 应 用 层 ，SCSI 协议 采用 C/S 体系 架构 ， 客 户 端 位 于 主机 ， 代 表 上 层 应 用 程序 、 文 
件 系 统 和 操作 系统 发 起 I/0 请 求 。 服 务 器 端 位 于 目标 设备 (如 ， 存 储 磁盘 ) 中 ， 对 客户 
端 I/0 请 求 做 出 响应 。CVS 请 求 和 响应 通过 其 下 层 协议 进行 传输 。 

在 传输 层 , SCSI 设备 之 间 通 过 一 系列 的 命令 实现 数据 块 的 传送 , 大 致 分 成 三 个 阶段 : 
命令 的 执行 ， 数 据 的 传送 和 命令 的 确认 。 

在 互 连 层 ， 发 送 方 和 SCSI 设备 进行 总 线 连接 ， 并 完成 发 送 方 和 目标 方 的 选择 等 功能 。 

当 互 连 层 完成 SCSI 设备 对 总 线 的 连接 ， 以 及 发 送 方 和 目标 方 的 选择 ， 传 输 层 协议 
执行 实际 的 数据 传输 。 发 起 方 通过 命令 描述 块 (CDB) 向 目标 方 发 送 具 体 的 命令 。 命 令 描 
述 块 有 定 长 和 不 定 长 两 种 格式 ， 而 定 长 格式 又 有 6 字 节 、10 字 节 、12 字 节 、16 字 节 不 
同 的 长 度 规定 ， 最 长 不 超过 16 字 节 。 

如 图 6-11 所 示 ， 一 个 命令 描述 块 (CDB) 包括 操作 码 、 命 令 参 数 和 控制 码 。 

操作 码 是 所 有 命令 描述 块 都 具有 的 共同 结构 ， 放 在 命令 描述 块 的 开头 一 个 字 节 。 
5 一 7 位 是 组 代码 ， 指 示 该 命令 具体 属于 哪个 命令 组 ， 它 决定 CDB 的 长 度 ，0 一 4 位 则 是 
具体 的 命令 代码 。8 比特 在 理论 上 共有 256 个 可 能 的 操作 码 。 

命令 参数 包含 以 下 五 个 字段 :(1) 混杂 CDB 信息 ， 表 示 与 具体 的 CDB 相关 的 信息 ， 
如 表示 逻辑 设备 号 ; (2) 逻辑 块 地 址 ， 指 逻辑 单元 中 起 始 操作 块 的 位 置 ; (3) 传送 长 度 ， 
表示 命令 所 请 求 的 传送 量 ， 通 常 是 块 数 ，(4) 参数 表 长 度 ， 表 示 需 要 传送 到 存储 设备 的 
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参数 的 长 度 ， de 二老 oa 表示 应 用 客户 为 缓冲 区 分 配 的 最 


大 长 度 ， 根 据 具体 的 CDB 类 别 ， 是 字 节 数 ， 也 可 能 是 块 数 。 
7 6 5 和 3 2 | 0 
者 am a | 


命令 参数 一 | 混杂 CDB 人 传送 参数 表 分 配 
1~n-1 字 节 信息 长 度 长 度 长 度 


控制 码 Pe | 链接 
风 c| rame | 。e 


图 6-11 CDB 结构 组 成 





控制 码 的 长 度 是 一 个 字 节 ， 包 括 一 些 厂 商 信息 ， 以 及 标准 自动 化 应 惫 处 理 Normal 
Auto Contingent Allegiance，NACA) 和 链接 字段 。 

SCSI 读 操 作 流 程 和 SCSI 写 操作 流程 基本 ， 但 数据 传送 的 方向 不 同 ， 读 流程 中 ， 数 
据 传输 方向 是 目标 方 一 发 起 方 ， 而 在 写 流程 中 ， 数 据 传输 方向 是 发 起 方 一 目标 方 。 

图 6-12 所 示 为 SCSI 读 操作 流程 ， 具 体 如 下 : 


发 起 方 目标 方 
OO API 接口 将 用 户 读 操 
作 转 换 为 SCSI 读 操作 


人 I 
1 
人 | 
在 指定 逻辑 单元 中 执 
加 传送 数据 ”| 图 | 行 该 命令 请 求 的 操作 
1 


1 
@ 数据 传输 完毕 后 ， 发 
送 命令 完成 的 报告 | 


接收 到 目标 方 命令 完成 En 
@ | 的 响应 ， 总 线 可 恢复 到 
空闲 阶段 


图 6-12 SCSI I0 读 操作 过 程 


Q@ 主机 操作 系统 首先 将 用 户 的 读 取 操 作 通 过 SCSI 1/0 的 应 用 程序 编程 接口 API 转 
化 为 SCSI 的 读 操 作 ， 并 在 操作 完成 后 通过 相应 的 API 返回 响应 值 ; 

@ 发 起 方 申请 SCSI 总 线 ，SCSI 总 线 经 历 空 闲 阶段 、 总 线 仲裁 和 选择 阶段 ， 使 得 发 
起 方 获 得 对 总 线 使 用 权 以 及 对 目标 方 的 选择 和 寻 址 ; 

@ 发 起 方 通过 CDB 向 目标 方 发 送 SCSI 的 读 命令 ; 
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由 目标 方 接收 到 该 命令 ， 通 过 设备 管理 器 在 指定 的 逻辑 单元 中 执行 该 命令 请 求 的 
操作 :; 

@ 目标 方 以 字 节 为 单位 向 发 起 方 传送 所 需要 的 数据 ; 

@ 在 数据 传输 完毕 后 ， 目 标 方向 发 起 方 发 送 命 令 完 成 的 报告 ; 

@ 发 起 方 接收 到 命令 完成 的 响应 ， 总 线 恢 复 到 空闲 阶段 。 


6.4 本章 小 结 RE 


本 章 介 绍 了 直接 连接 存储 (DAS) 存储 架构 的 概念 、 特 点 和 分 类 ， 并 介绍 了 主机 与 
存储 设备 通信 的 基本 协议 一 SCSI 协议 的 方方面面 。 首 先 概括 了 SCSI 协议 的 版 本 演变 
(SCST-1、SCST-2、SCSI-3)， 然 后 重点 介绍 了 SCSI-3 协议 。 上 基体 地 ，SCSI-3 协议 的 通 
言 过 程 分 为 五 阶段 : 总线 忙 一 寻 址 一 协商 一 连接 一 断 开 连接 ， 寻 址 依据 为 总 线 号 (BUS ID) 
一 设备 号 (SCST ID) 一 逻辑 单元 号 (LUN ID) 三 部 分 ，SCSI-3 的 协议 模型 分 为 三 层 : 
SCSI 命令 层 / 应 用 层 、 传 输 层 、 物 理 层 。SCSI 采用 C/S 模型 进行 通信 ， 应 用 层 发 起 I/0 
请 求 ， 传 输 层 实现 数据 块 的 传送 ， 物 理 层 完 成 SCSI 设备 对 总 线 的 连接 。 


练习 题 


一 、 判 断 题 


. 正确 的 SCSI 协议 传输 流程 是 ( ) 
.总线 忙 -协商 - 寻 址 -连接 - 断 开 连 接 
.总 线 忙 - 寻 址 -协商 -连接 - 断 开 连接 
. 寻 址 -协商 = 总 线 忙 -连接 - 断 开 连接 
.协商 -总 线 忙 - 寻 址 -连接 - 断 开 连 接 





1. DAS 解决 方案 不 方便 共享 存储 ， 容 易 形成 存储 的 孤岛 。( ) 
2. 内 部 DAS 管理 硬盘 分 区 是 基于 阵列 的 管理 。( ) 
二 、 选 择 题 

1. DAS 的 优点 不 包括 ) 

A。 对 于 小 型 环境 来 说 部 署 迅速 B. 投资 小 

C. 扩展 性 好 D， 复 杂 度 小 
2. SCSI 寻 址 包括 ( 

A. 设备 号 B. 逻辑 单元 号 
C， 总 线 号 D， 扇 区 号 

3 

A 

B 

C 

D 
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三 、 填 空 题 

1. 如 果 SCSI 总 线 采 用 的 是 16 位 窗 线 ， 则 连接 的 设备 数 为 ( ) 
优先 级 最 高 为 〈 )， 优 先 级 最 低 为 〈 让 

2，SCSI 协议 模型 由 ( ) x bp ) 三 部 分 组 成 。 

四 、 思 考题 


1. SCSI 协议 的 读 操 作 具 体 包括 哪些 流程 ? 


2. DAS 有 哪些 优 /缺点 ? 如 何 克 服 DAS 的 缺点 ? 
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， 其 中 
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7.1 ”SAN 存储 基础 
7.2 FC SAN 
7.3 IP SAN 

7.4 FCoE 

7.5 ”本 章 小 结 
练习 题 





存储 区 域 网 络 (Storage Area Network，SAN) 是 一 种 面向 网 络 的 、 以 数据 存储 为 
中 心 的 存储 架构 。SAN 采用 可 扩展 的 网 络 拓扑 结构 连接 服务 器 和 存储 设备 ， 并 将 数据 的 
存储 和 管理 集中 在 相对 独立 的 专用 网 络 中 ， 向 服务 器 提供 数据 存储 服务 。 以 SAN 为 核心 
的 网 络 存 储 系统 具有 良好 的 可 用 性 、 可 扩展 性 、 可 维护 性 ， 能 保障 存储 网 络 业务 的 高 效 
运行 。 本 章 分 为 四 个 部 分 ， 分 别 介绍 了 SAN 的 基础 知识 ; 使 用 FC 技术 的 FC SAN; 使 用 
IP 技术 的 IP SAN; 使 用 FCoE 技术 的 融合 网 络 。 


祖 





e 识别 主要 的 SAN 组 件 ; 
e 了 解 SAN 组 件 ; 

e 掌握 SAN 的 组 网 方式 ; 
e 清楚 多 路 径 问题 ; 

e 了 解 光纤 通道 的 框架 ; 
e 理解 光纤 的 工作 方式 。 





7.1.1 SAN 概念 


传统 数据 存储 DAS 在 以 下 几 个 方面 存在 不 足 。 
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(1) 存储 空间 得 不 到 有 效 的 利用 。DAS 存储 不 管 是 使 用 内 置 的 磁盘 空间 ， 还 是 
通过 直 连 磁盘 陈列 来 获取 空间 ， 都 避免 不 了 主机 系统 之 间 形 成 多 个 数据 孤岛 的 问 
题 。 每 个 单独 的 小 “岛屿 ”都 是 一 个 专门 直接 连接 的 存储 器 应 用 ， 导 致 存储 内 容 无 
法 共享 ， 存 储 空间 无 法 合理 利用 。 人 例如， 有些 应 用 服务 器 由 于 应 用 数据 少 而 留 着 很 
大 的 存储 空间 处 于 空闲 状态 ， 而 有 些 应 用 服务 器 的 数据 量 相当 大 ， 空 闲 存储 空间 很 
小 ; 从 而 ， 存 储 资源 得 不 到 合理 利用 ， 浪 费 了 很 多 宝贵 的 存储 资源 ， 增 加 了 用 户 的 
整体 拥有 成 本 。 

(2) 存储 空间 无 法 满足 日 益 增 长 的 数据 需求 。 存 储 空间 主要 依赖 于 服务 器 上 自 带 硬 
盘 ， 而 每 台 服务 器 能 够 挂 接 的 硬盘 数量 是 有 限 ， 随 着 业务 的 发 展 ， 需 要 保存 的 数据 量 必 
然 陡 增 ， 所 需 存储 空间 也 会 越 来 越 大 ， 仅 仅 依靠 本 机 的 存储 空间 已 经 无 法 满足 要 求 。 况 
且 ， 每 一 次 安装 硬盘， 都 需要 给 服务 器 断 电 ， 进 而 中 断 业 务 的 运行 ， 同 时 数据 管理 变 得 

杂 ， 数 据 放 置 过 于 分 散 ， 大 大 加 重 了 管理 员 的 负担 。 

(3) 存储 架构 无 法 满足 日 益 发 展 的 业务 需求 。 由 于 采用 了 硬盘 挂 接 在 服务 器 上 这 
种 存储 架构 ， 服 务 器 上 任意 部 件 〈 如 内 存 、 和 硬盘、 硬盘 连接 线 等 ) 发 生 故 障 ， 都 会 使 
服务 器 运行 中 断 ， 业 务 和 应 用 停止 服务 。 对 用 户 而 言 ， 业 务 的 中 断 带 来 了 经 济 损失 ， 
影响 经 济 效益 ， 而 且 业 务 的 中 断 对 企业 信誉 也 是 一 种 致命 的 打击 ， 造 成 负面 影响 。 所 
以 需要 一 种 高 效 、 安 全 而 且 可 靠 的 存储 架构 来 保障 信息 数据 的 安全 和 可 用 性 ， 保 证 业 
务 的 持续 性 。 

(4) 存储 架构 可 扩展 性 差 。 可 扩展 性 是 指 现 有 投资 在 受到 保护 的 情况 下 ， 不 影响 业 
务 的 前 提 下 ， 通 过 添加 新 设备 而 达到 客户 新 的 规模 要 求 和 性 能 要 求 。 以 扩充 容量 〈 即 ， 
扩容 ) 为 例 ， 对 于 传统 数据 存储 而 言 ， 扩 容 不 仅 意 味 着 往 服务 器 上 增加 新 的 硬盘 ， 还 需 
要 将 一 部 分 数据 从 已 有 硬盘 迁移 到 新 增 硬盘 上 。 这 种 扩容 意味 着 现 有 存储 架构 的 可 扩展 
性 不 好 ， 理 想 的 扩容 应 该 是 在 保证 业务 连续 性 的 前 提 下 ， 通 过 添加 存储 设备 〈 如 硬盘 ) 
从 而 达到 客户 扩容 要 求 的 方案 。 

针对 以 上 问题 ， 业 界 提 出 了 存储 区 域 网 络 (Storage Area Network，SAN)， 通 常人 
们 将 SAN 技术 视 为 DAS 技术 的 一 个 替代 者 “” 。 存 储 网 络 工业 协会 SNIA 对 于 SAN 的 标 
准 定 义 是 :“A network whose primary purpose is the transfer of data between 
computer Systems and Storage elements and among storage elements. Abbreviated 
SAN”， 即 ，SAN 是 用 来 在 计算 机 系统 和 存储 单元 之 间 、 存 储 单元 与 存储 单元 之 间 进 行 数 
据 传输 的 网 络 系统 。SAN 包含 一 个 通信 系统 基础 结构 ， 包 括 物理 连接 、 管 理 层 、 存 储 单 
元 和 计算 机 系统 ， 以 确保 数据 传输 的 安全 性 和 稳定 性 。 

SAN 是 服务 器 和 存储 资源 之 间 的 一 个 高 性 能 的 专用 网 络 体系 ， 它 提供 存储 装置 、 计 
算 机 主机 及 相关 网 络 设 备 的 管理 机 制 ， 并 且 提 供 强 而 有 力 且 安全 的 数据 传输 环境 ， 它 为 
了 实现 大 量 原 始 数据 的 传输 而 进行 了 专门 的 优化 。SAN 通常 被 认为 是 提供 数据 块 存 取 
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(Block I/0) 服务 而 非 档 案 存 取 服务 , 但 这 并 不 是 SAN 的 必要 条 件 ， 事 实 上 ， 可 以 把 SAN 
看 成 是 对 SCSI 协议 在 长 距离 应 用 上 的 扩展 。 

利用 SAN 可 以 构架 理想 的 存储 结构 ， 这 种 理想 的 存储 结构 包括 如 下 特征 : 

(1) 具有 可 伸缩 能 力 ; 

(2) 可 扩展 到 整个 世界 ; 

(3) 非常 可 靠 ， 

(4) 提供 尽 可 能 高 的 传输 速度 ; 

(5) 易于 管理 。 

例如 ， 华 为 技术 有 限 公 司 ,在 全 球 有 超过 100 000 的 员工 , 假设 在 荷兰 工作 的 员工 ， 
希望 能 够 访问 存储 在 深圳 总 公司 存储 设备 上 的 相关 数据 ， 那 么 要 求 它 是 “能 扩展 到 整个 
世界 ”的 存储 架构 设计 。 一 个 设计 良好 的 存储 架构 ， 可 以 运行 很 多 年 。 当 设计 一 个 庞大 
的 信息 通信 (ICT》 基 础 设施 时 ， 需 要 如 下 的 设计 需求 列表 : 

(1) 设计 可 以 无 限 扩 展 ， 可 以 方便 地 增加 方案 中 的 设备 数量 ; 

(2) 设计 能 够 允许 各 个 组 件 之 间 的 距离 没有 限制 或 限制 较 小 。 在 实践 中 , 相距 20000 
公里 的 设备 组 件 是 允许 互联 的 ; 

(3) 设计 必须 是 可 靠 的 ， 当 发 生硬 件 故障 或 者 人 为 失误 时 ， 也 不 会 给 公司 造成 严重 
的 问题 ; 

(4) 相互 连接 的 组 件 之 间 能 够 以 最 快 的 速度 进行 通信 ; 

(5) 即使 设计 非常 复杂 ， 少 数 的 技术 员 也 可 以 维护 和 监控 整个 存储 架构 中 的 设备 。 
ICT 部 门 不 需要 50 个 人 来 管理 50 台 或 者 100 台 设 备 。 低 成 本 、 高 效率 的 管理 也 是 一 
个 大 的 设计 需求 ; 

(6) 设计 应 该 是 灵活 的 。 在 基础 设施 中 改变 、 替 换 和 增加 组 件 不 会 有 任何 限制 ， 这 
意味 着 即使 经 过 几 年 技术 的 发 展 ， 仍 然 可 以 将 新 技术 集成 到 当前 的 基础 设施 中 : 

(7) 设计 应 该 支持 异 构 。 异 构 是 指 来 自 不 同 厂商 的 设备 可 以 像 来 自 同一 个 厂商 的 设 
备 那样 一 起 工作 。 支 持 异 构 是 存储 架构 设计 中 的 一 个 重要 挑战 ， 并 不 容易 做 到 : 一 方面 ， 
大 多 数 的 客户 只 会 购买 一 个 公司 的 设备 ， 因 为 客户 往往 只 想 和 一 个 硬件 供应 商 签订 服务 
合同 ， 以 防止 在 发 生 技术 问题 的 时 候 ， 需 要 去 联系 多 个 厂家 的 技术 支持 团队 ; 另 一 方面 ， 
又 不 能 过 于 依赖 同一 个 公司 ， 以 免 这 个 公司 的 产品 出 现 批 次 问题 或 者 其 它 问题 时 ， 影 响 
本 公司 的 正常 运转 。 另 外 ， 如 果 系 统 支持 异 构 ， 那 么 当 从 一 个 公司 的 产品 切换 到 另外 一 
个 公司 的 设备 时 ， 将 更 容易 进行 迁移 。 


7.1.2 SAN 组 网 


SAN 也 叫 存储 区 域 网 络 ， 它 是 将 存储 设备 〈 如 ， 磁 盘 阵 列 、 磁 带 库 、 光 盘 库 等 ) 与 
服务 器 连接 起 来 的 网 络 。 结 构 上 ，SAN 允许 服务 器 和 任何 存储 设备 相连 ， 并 直接 存储 所 
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需 数 据 。 图 7-1 所 示 是 一 种 典型 的 SAN 组 网 方式 。 


机 哥 服 务 器 


























图 7-1 SAN 的 组 网 


相对 于 传统 数据 存储 方式 ，SAN 可 以 跨 平 台 使 用 存储 设备 ， 可 以 对 存储 设备 实现 统 
管理 和 容量 分 配 ， 从 而 降低 使 用 和 维护 的 成 本 ， 提 高 存储 的 利用 率 。 根 据 Forrester 

研究 报告 , 使 用 传统 独立 存储 方式 时 存储 利用 率 介 于 40% 一 80% 之 间 , 平均 利用 率 是 60%， 
存储 通常 处 于 低 利用 率 状态 ”。SAN 对 存储 资源 进行 集中 管控 ， 高 效 利用 存储 资源 ， 有 
助 于 提高 存储 利用 率 。 更 高 的 存储 利用 率 意味 着 存储 设备 的 减少 ， 网 络 中 的 电能 能 耗 和 
制冷 能 耗 降低 ， 节 能 省 电 。 

此 外 ， 通 过 SAN 网 络 主机 与 存储 设备 连通 ，SAN 为 在 其 网 络 上 的 任意 一 台 主 机 和 存 
储 设 备 之 间 提 供 专用 的 通信 通道 ， 同 时 SAN 将 存储 设备 从 服务 器 中 独立 出 来 。SAN 支持 
通过 光纤 通道 协议 (Fibre Channel，FC》 和 IP 协议 组 网 ， 支 持 大 量 、 大 块 的 数据 传 
输 ; 同时 满足 吞吐 量 、 可 用 性 、 可 靠 性 、 可 扩展 性 和 可 管理 性 等 方面 的 要 求 。 如 图 7-2 
所 示 。 

由 图 7-2 可 以 看 到 ，SAN 和 LAN 相互 独立 ， 这 个 特点 的 优势 在 上 文 已 经 提 过 ， 然 而 
它 会 带 来 成 本 和 能 耗 方面 的 一 些 不 足 : (1) SAN 需要 建立 专属 的 网 络 ， 这 就 增加 了 网 络 
中 线 缆 的 数量 和 复杂 度 ; (2) 应 用 服务 器 除了 连接 LAN 的 网 卡 之 外 ， 还 需 配 备 与 SAN 交 
换 机 连接 的 主机 总 线 适 配器 (Host Bus Adapter，HBA)。 
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应 用 服务 器 





存储 设备 存储 设备 “ll 
图 7-2 SAN 的 网 络 拓扑 架构 示意 图 


7.1.3 SAN 组 件 


SAN 由 三 个 基本 组 件 组 成 : 服务 器 、 网 络 基础 设施 和 存储 。 这 些 组 件 可 以 进一步 的 
划分 ， 分 别 是 : 端口 、 连 接 设备 、 集 线 器 、 存 储 阵 列 等 。 

(1) SAN 网 络 服务 器 

所 有 SAN 解决 方案 中 ， 服 务 器 基础 结构 是 其 根本 ， 其 基础 结构 可 以 是 多 种 服务 器 平 
台 的 混合 体 ， 包 括 Windows、UNIX、Linux 和 Mac 0S 等 。 

(2) SAN 网 络 存储 

光纤 接口 存储 设备 是 存储 基础 结构 核心 。SAN 存储 基础 结构 能 够 更 好 地 保存 和 保护 
数据 ， 能 够 提供 更 好 的 网 络 可 用 性 、 数 据 访 问 性 和 系统 管理 性 。SAN 为 了 使 存储 设备 与 
服务 器 解 耦 ， 使 其 不 依赖 于 服务 器 的 特定 总 线 ， 将 存储 设备 直接 接 入 网 络 中 。 从 另 一 个 
角度 看 ， 存 储 设备 做 到 了 外 置 或 外 部 化 ， 其 功能 分 散在 整个 存储 系统 内 部 。 

(3) SAN 网 络 互 连 

实现 SAN 的 第 一 个 要 素 是 通过 FC 等 通道 技术 实现 存储 和 服务 器 组 件 的 连通 。 所 使 
用 的 组 件 是 实现 LAN 和 WAN 所 使 用 的 典型 组 件 。 与 LAN 一样 ，SAN 通过 存储 接口 的 互 连 
形成 很 多 网 络 配置 ， 并 能 够 跨越 很 长 的 距离 。 除 了 线 缆 和 连接 器 ， 还 包括 如 下 具体 互 连 
设备 : 

一 交换 机 :交换 机 是 用 于 连接 大 量 设 备 、 增 加 带宽 、 减 少 阻塞 和 提供 高 吞吐 量 的 一 
种 高 性 能 设备 。 

一 网 桥 : 网 桥 的 作用 是 使 LAN/SAN 能 够 与 使 用 不 同 协议 的 其 他 网 络 通信 。 
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一 集线器 : 通过 集线器 ， 仲 裁 环 线路 上 一 个 逻辑 环 路 上 可 以 连接 多 达 127 个 设备 。 

一 网 关 : 网 关 是 网 络 上 用 来 连接 两 个 或 更 多 网 络 或 设备 的 站 点 ， 是 一 个 网 络 连接 到 
另 一 个 网 络 的 接口 ， 也 用 于 两 个 高 层 协议 不 同 的 网 络 互 连 ， 也 被 称 为 网 间 连 接 器 、 协 议 
转换 器 。 网 关 产 品 通常 用 来 实现 LAN 到 WAN 的 访问 ， 通 过 网 关 ，SAN 可 以 延 伟 和 链接 。 

(4) SAN 网 络 端口 有 三 种 常用 端口 。 

1) FC 接口 使 用 FC 协议， 使 用 该 种 协议 的 SAN 架构 ， 称 为 FC SAN; 

2) ETH 接口 使 用 iSCSI 协议 ， 使 用 该 种 协议 的 SAN 架构 ， 称 为 IP SAN; 

3) FCoE 接口 使 用 FCoE 协议 ， 使 用 该 种 协议 的 SAN 架构 ， 称 为 FCoE SAN。 


7.1.4 DAS 和 SAN 区 别 


SAN 网 络 和 DAS 直 连 一 样 ， 都 是 以 SCSI 块 的 方式 发 送 数据 ， 将 数据 从 存储 设备 传送 
到 服务 器 上 。 当 然 ，SAN 网 络 和 DAS 直 连 有 一 些 显著 的 区 别 ， 如 价格 ， 用 户 购 买 SAN 网 
络 所 需 花 销 远 远大 于 DAS， 如 DAS 缆 线 的 连接 范围 在 25 米 以 内 ， 而 SAN 网 络 连接 则 可 以 
长 达 数 百 或 者 数 千 公里 等 等 。 

在 一 个 基于 SAN 网 络 架 构 的 解决 方案 中 , SAN 不 只 会 在 网 络 上 发 送 单独 的 SCSI 协议 
块 , 而 是 将 SCSI 协议 块 封 装 到 一 个 数据 包 或 者 数据 帧 中 , 利用 网 络 将 数据 包 传输 到 更 远 
的 距离 。 数 据 包 就 好 像 是 一 个 信封 ， 我 们 可 以 利用 信封 来 把 信 传 递 给 某 和 人 。 信 可 以 看 成 
是 用 户 数 据 ， 而 信封 就 是 数据 包 。 事 实 上 ， 我 们 不 可 能 通过 将 信纸 放 在 地 上 ， 然 后 让 风 
将 信纸 送 到 收 信 人 的 地 址 。 所 以 一 个 好 的 办 法 是 将 信纸 装 入 到 信封 ， 并 且 贴 上 邮票 ， 然 
后 写 上 正确 的 地 址 信息 并 把 信 塞 入 一 个 邮箱 。 国 家 邮政 服务 人 员 将 信件 从 邮箱 取出 ， 并 
将 它 传递 到 收 信人 手中 。 当 然 ， 也 有 其 他 的 办 法 可 以 将 信 送 到 收 信人 和 手中， 一 个 替代 办 
法 是 选择 专业 的 快递 服务 公司 ， 例 如 UPS 或 者 FedEx。 他 们 有 自己 的 投递 系统 ， 你 需要 
将 这 封 信 放 入 到 一 个 特殊 的 信封 中 。 然 后 ， 负 责 送 货 服务 的 传输 系统 将 负责 把 信 送 到 收 
信人 手中 。 

现在 有 多 种 方法 将 SCSI 块 发 送 到 跨 SAN 的 连接 中 ， 这 些 方法 被 称 为 协议 ， 每 个 协 
议 都 有 不 同 的 方法 来 描述 处 理 SCSI 块 的 传输 方式 。 如 上 所 述 ，FC、iSCSI 和 FCoE 是 SAN 
网 络 架 构 中 三 种 常用 协议 ，FC 协议 通常 和 iSCSI 协议 用 于 现代 的 SAN 架构 中 ， 而 FCoE 
协议 主要 用 于 SAN 和 LAN 业务 融合 场景 ， 表 7-1 从 协议 、 应 用 场景 、 优 缺点 等 几 个 方面 
来 对 比 DAS 和 SAN 两 种 存储 架构 。 

从 连接 方式 上 对 比 ，DAS 采用 了 直接 连接 ， 即 ， 存 储 设备 直接 连接 应 用 服务 器 ， 但 
是 扩展 性 较 差 ，SAN 网 络 则 是 通过 多 种 技术 来 连接 存储 设备 和 应 用 服务 器 ， 具 有 很 好 的 
传输 速率 和 扩展 性 。SAN 不 受 现今 主流 的 、 基 于 SCSI 存储 结构 的 布局 限制 。 特 别 重 要 的 
是 , 随 着 存储 容量 的 爆炸 性 增长 ，SAN 允许 独立 地 增加 它们 的 存储 容量 。SAN 网 络 的 结构 
允许 任何 服务 器 连接 到 任何 存储 阵列 ， 这 样 不 管 数据 置 放 在 那里 ， 服 务 器 都 可 直接 存 取 
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所 需 的 数据 。 因 为 采用 了 光纤 接口 ，SAN 还 具有 更 高 的 带宽 。 
表 7-1 DAS 和 SAN 区 别 


低 
不 易于 扩展 





是 否 集中 管理 





备份 效率 页 
无 光纤 通道 协议 
DAS 存储 一 般 应 用 在 中 小 企业 ， 与 计算 机 采用 直 连 方式 ; SAN 网 络 则 使 用 光纤 接口 ， 
提供 高 性 能 、 高 扩展 性 的 存储 ， 其 应 用 场景 包括 : (1) 对 数据 安全 性 要 求 很 高 的 企业 ， 
如 ， 人 金融 、 证 券 和 电信 : (2) 对 数据 存储 性 能 要 求 高 的 企业 ， 如 ， 电 视 台 、 测 绘 部 门 和 
交通 部 运输 部 门 : (3) 具有 本 质 上 物理 集中 、 逻辑 上 又 彼此 独立 的 数据 管理 特点 的 企业 ， 
如 银行 、 证 券 和 电信 等 行业 。 








7.2- FC SAN 


随 着 当今 社会 对 信息 存储 需求 的 空前 增加 ， 对 信息 存储 系统 的 性 能 ， 信 息 网 络 的 利 
用 率 和 信息 的 备份 、 容 灾 能 力 都 有 更 高 的 要 求 ，SAN 可 以 很 好 地 满足 数据 统一 存储 、 企 
业 数 据 共享 、 远 程 数据 容 灾 等 的 需要 。 随 着 IT 技术 的 迅速 发 展 及 各 种 数据 的 集中 化 ， 建 
立 一 个 基于 SAN 的 存储 体系 结构 也 已 经 成 为 信息 化 的 必然 之 路 。 FC SAN 是 当今 SAN 网 络 
中 的 主流 ， 在 高 性 能 应 用 环境 中 占 主要 份额 。 


7.2.1 FC SAN 概念 


20 世纪 80 年 代 ， 随 着 计算 机 处 理 器 的 运算 能 力 的 提高 ， 外 部 设备 的 1/0 带宽 成 为 
整个 存储 系统 的 一 大 瓶颈 。 为 了 解决 1/0 瓶颈 对 整个 存储 系统 所 带 来 的 消极 影响 ， 提 高 
存储 系统 的 存 取 性 能 ， 美 国 国家 标准 委员 会 (ANST) 的 X3T11 工作 组 于 1988 年 开始 制定 
一 种 高 速 串 行 通信 协议 一 一 光纤 通道 协议 (Fibre Channel，FC)。FC 协议 制定 的 初衷 是 
用 来 提高 硬盘 传输 带宽 ， 侧 重 于 数据 的 快速 、 高 效 、 可 靠 传输 。 随 着 技术 发 展 ， 该 协议 
将 快速 可 靠 的 通道 技术 和 灵活 可 扩展 的 网 络 技术 有 机 地 融合 在 一 起 ， 既 提供 通道 所 需要 
的 指令 集 ， 也 提供 网 络 所 需要 的 各 种 协议 ， 因 此 ， 它 不 仅 能 够 进行 数据 的 高 速 传输 、 音 
频 和 视频 信号 的 串 行 通信 ， 而 且 为 网 络 、 存 储 设备 和 数据 传送 设备 提供 了 实用 、 廉 价 和 
可 扩展 的 数据 交换 标准 , 并 能 广泛 用 于 高 性 能 大 型 数据 仓库 、 数 据 存储 备份 和 恢复 系统 、 
基于 网 络 的 存储 、 高 性 能 的 工作 组 、 数 据 的 视 / 音 频 网 络 等 等 。 这 些 特点 使 得 FC 协议 在 
整个 20 世纪 90 年 代 都 得 到 了 人 们 的 认可 , 并 且 从 20 世纪 90 年 代 末 开 始 FC SAN 得 到 大 
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规模 的 广泛 应 用 。 目 前 ，FC 协议 被 用 在 绝 大 多 数 高 容量 、 高 端 直 连 存储 设备 上 。 

FC SAN 是 指使 用 FC 协议 的 SAN 网 络 。 作 为 SAN 网 络 中 第 一 个 成 功 的 千 兆 位 串 行 传 
输 技术 ，FC 已 成 为 最 适合 块 1/0 应 用 的 体系 结构 。FC 满足 存储 网 络 对 传输 技术 的 下 列 
需求 : 

(1) 高 速 长 距离 的 串 行 传输 ; 

(2) 大 规模 网 络 应 用 中 的 异步 通信 ; 

(3) 较 低 的 传输 误 码 率 ; 

(4) 较 低 的 数据 传输 延迟 ; 

(5) 模块 化 和 层次 化 结构 ; 

(6) 传输 协议 可 在 HBA 上 以 人 硬件 方式 实现 ， 减 少 对 服务 器 CPU 的 占用 。 


7.2.2 FC 协议 栈 


光纤 通道 协议 其 实 并 不 能 翻译 成 光纤 协议 ， 只 是 FC 协议 普遍 采用 光纤 作为 传输 线 
缆 ， 因 此 很 多 人 把 FC 称 为 光纤 通道 协议 。 在 罗 辑 上 ， 我 们 可 以 将 FC 看 作 是 一 种 用 于 构 
造 高 性 能 信息 传输 的 、 双 向 的 、 点 对 点 的 串 行 数据 通道 。 在 物理 上 ，FC 是 一 到 多 对 应 的 
点 对 点 的 互 连 链 路 ， 每 条 链 路 终结 于 一 个 端口 或 转发 器 。FC 的 链 路 介质 可 以 是 光纤 、 双 
绞 线 或 同 轴 电 缆 。 

光纤 通道 是 一 种 通用 的 传输 通道 , 它 能 够 为 多 种 高 层 协议 (Upper Level Protocols， 
ULP) 提供 高 性 能 的 传输 通道 ， 协 议 包 括 智 能 外 设 接口 (Intelligent Peripheral 
Interface，IPI) 命令 集 、 小 型 计算 机 系统 接口 (Small Computer System Interface， 
SCSI) 命令 集 或 高 性 能 并 行 接口 (High-Performance Parallel Interface，HiPPI) 数 
据 帧 、 互 联网 协议 〈Internet Protocol，IP)、IEEES02. 2 等 。 

光纤 通道 是 一 种 基于 标准 的 网 络 结构 。 它 的 标准 定义 了 物理 层 的 特征 、 传 输 控制 方 
法 以 及 与 TCP/IP、SCSI-3、HiPPI 和 其 他 一 些 协 议 的 上 层 接 口 。 光 纤 通 道 是 一 种 千 兆 位 
传输 技术 ， 目 前 的 实现 支持 最 高 可 达 64 Gbit/s 的 传输 速率 。 

光纤 通道 标准 定义 了 一 个 通过 网 络 移动 数据 的 多 层 结 构 。 它 的 协议 被 划分 为 5 个 层 
次 ， 如 图 7-3 所 示 。 

FC-0 层 描述 物理 接口 ， 包 括 传 送 介质 、 发 射 机 和 接收 机 及 其 接口 。FC-0 层 规定 了 
各 种 介质 和 与 之 有 关 的 能 以 各 种 速率 运行 的 驱动 器 和 接收 机 。 

FC-1 层 中 定义 了 FC 的 底层 传输 协议 ， 包 括 串 行 编码 、 解 码 和 链 路 状态 维护 。 它 描 
述 了 8B/10B 的 编码 规则 ,使 控制 字 节 与 数据 字 节 分 离 且 可 简化 比特 , 字 节 和 字 同 步 ,该 
编码 还 具有 检测 某 些 传送 和 接收 误差 的 机 制 。 在 FC-1 层 中 由 几 个 专用 字符 组 合 在 一 起 ， 
并 通过 字符 命令 集 来 表示 一 定 的 特殊 含义 ， 如 : 帧 边界 、 简 单传 输 请 求 或 通过 周期 性 的 
交互 维持 链 路 传输 状态 。 
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_FC-3 公共 服务 : 加 密 解密 





FC-0 物理 转化 〔 铜 缆 / 光 继 ) 


图 7-3 ”光纤 通道 协议 栈 


FC-2 层 是 信 令 协议 层 , 它 规定 了 需要 传送 成 块 数据 的 规则 和 机 制 ,在 所 有 协议 层 中 ， 
FC-2 层 是 最 复杂 的 一 层 ， 它 提供 不 同类 型 的 服务 ， 分 组 ， 排 序 ， 检 错 ， 传 送 数据 的 分 段 
重组 ， 以 及 协调 不 同 容 量 的 端口 之 间 的 通信 需要 的 注册 服务 。 

FC-3 层 提供 的 一 系列 服务 ， 是 光纤 通路 节点 的 多 个 N 端口 所 公用 的 。 尽 管 这 层 没有 
明确 定义 ， 但 是 它 所 提供 的 功能 适用 于 整个 体系 结构 未 来 的 扩展 ， 例 如 多 路 复 用 和 地 址 
绑 定 功能 。 

FC-4 层 提 供 了 光纤 通路 到 已 存在 的 更 上 层 协 议 的 映射 ， 这 些 协议 包括 IP、SCSI 协 
议 、HiPPI 等 。 例 如 ， 串 行 SCSI 必须 将 光纤 通道 设备 映射 为 可 被 操作 系统 访问 的 逻辑 设 
备 。 对 于 主机 总 线 适 配器 ， 这 种 功能 一 般 要 由 厂商 提供 的 设备 驱动 器 程序 来 实现 。 

FC 协议 数据 帧 及 数据 包 的 发 送 和 接收 是 在 FC-2 层 实现 的 ， 每 个 光纤 通道 帧 由 多 个 
4 字 节 的 传输 字 组 成 。 一 个 光纤 通道 帧 最 多 由 537 个 传输 字 组 成 ， 最 大 传输 2148 字 节 的 
数据 。 如 表 7-2 所 示 ， 光 纤 通 道 帧 由 以 下 几 部 分 组 成 。 

表 7-2 光纤 通道 帧 格式 


24 字 节 ， 帧 头 决定 使 用 何 种 协议 ， 以 及 来 源 和 目的 地 地 址 

包含 以 下 几 种 可 选 字段 和 固定 字段 : 
1) 可 选 ESP 帧 头 ，8 字 节 ,提供 编码 和 序列 号 ， 

2) 可 选 网 络 帧 头 ，16 字 节 ， 这 样 你 可 以 将 FC SAN 连接 到 非 FC 


















可 选 帧 头 (0ptional Header) 





3) 可 选 关 联 帧 头 : 32 字 节 ， 不 是 光纤 通道 协议 使 用 的 ， 但 可 用 于 
确定 节点 内 的 流程 ; 

4) 可 选 设备 帧 头 : 最 多 64 字 节 ， 不 是 光纤 通道 协议 使 用 的 ， 用 
于 特定 应 用 程序 


区 据 ， 最 多 可 达 贡 全 


可 选 填写 字 节 (Optional Fill | 用 于 保证 数据 载荷 的 大 小 不 超过 字 节 界限 ， 或 可 选 ESP 尾 
bytes) (COptional Trailer):， 包含 ESP 检验 值 

循环 元 余 校 验 (CRC) 一 个 帧 头 CRC 和 光纤 通道 数据 字段 

4 字 节 ， 并 且 表 示 是 否 是 序列 的 最 后 一 位 
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帧 起 始 SOF 和 帧 结尾 EOF 扮演 着 分 隔 符 的 角色 ， 此外，SOF 也 是 一 个 标记 ， 标 识 一 
个 帧 是 否 为 一 个 帧 序列 的 第 一 帧 。 一 个 完整 的 FC 协议 帧 如 图 7-4 所 示 。 


ldies SOF Header CRC EOF Idles 
空闲 帧 的 开始 头 部 校 验 帧 的 结束 空闲 


TW — 528 TW or TW 
| 537 TW or 2148 bytes 









Optional headers 
+PAYLOAD 
数据 字段 





0 2112 bytes 





图 7-4 光纤 通道 协议 由 
当 上 层 协议 的 数据 单元 长 度 大 于 光纤 通道 数据 帧 负载 的 最 大 长 度 2112 个 字 节 时 ， 
则 需要 被 分 割 成 多 个 数据 帧 ，FC-2 层 将 这 些 数据 帧 称 为 帧 序列 。 一 个 帧 序列 表示 一 个 上 
层 协议 数据 单元 ， 而 上 层 应 用 程序 对 数据 的 操作 通常 基于 一 个 个 帧 操作 ， 一 个 操作 包括 
双向 的 几 个 数据 单元 交换 ， 因 此 ， 用 帧 交换 来 表示 上 层 协 议 的 一 个 操作 ， 一 个 帧 交换 内 
只 能 有 一 个 帧 序列 处 于 活动 状态 。 数 据 包 是 由 一 个 或 若干 个 帧 交换 组 成 。 


7.2.3 FC 与 SCS| 协议 关系 
图 7=5 给 出 FC 与 SCSI 协议 的 关系 。 





图 7-5 FC 与 SCSI 协议 的 关系 


FC 通道 并 不 是 替代 SCSI 的 ，FC 可 以 通过 构建 帧 来 传输 SCSI 指令 、 数 据 和 状态 信 
息 单 元 。 
SCSI 是 位 于 光纤 通道 协议 栈 FC-4 的 上 层 协议 ，SCSI 是 FC 协议 的 子 集 。 


7.2.4 FC 典型 组 网 拓扑 和 连接 设备 
光纤 通道 的 层次 基本 上 相当 于 0SI 参考 模型 的 较 低层 ， 并 且 可 以 看 成 是 链 路 层 的 网 
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络 。 光 纤 通 道 呈 现 为 单个 不 可 分 割 的 网 络 ， 并 在 整个 网 络 中 使 用 统一 的 地 址 空间 。 虽 然 
在 理论 上 这 个 地 址 空间 可 以 非常 大 ， 在 单个 网 络 中 可 以 有 千 万 个 地 址 ， 但 实际 上 光纤 
通道 通常 在 一 个 SAN 中 只 支持 数 十 台 设 备 ， 或 者 在 某 些 大 型 数据 中 心 应 用 中 支持 上 百 台 
设备 。 

光纤 通道 用 拓扑 结构 来 描述 各 个 节点 的 连接 方式 。 光 纤 通 道 术 语 中 的 “节点 ”是 指 
通过 网 络 进行 通信 的 任何 实体 ， 而 不 一 定 是 一 个 便 件 节点 ， 这 个 节点 通常 是 一 个 设备 ， 
如 一 个 磁盘 存储 器 、 服 务 器 上 的 一 个 主机 总 线 适配器 或 者 是 一 个 光纤 网 交换 机 。 如 图 7-6 
列 出 三 种 光纤 通道 的 拓扑 结构 。 


点 对 点 仲裁 环 光纤 通道 交换 网 络 
司 a 
加 一 图 国 、 ,图 
转交 图 网 3 呈 人 
党 [el 
只 能 连接 两 个 设备 最 多 支持 127 个 设备 最 多 支持 1 千 6 百 万 个 设备 
(直接 连接 ) (光纤 集线器 ) (光纤 通道 交换 机 ) 


图 7-6 光纤 通路 三 种 拓扑 结构 


点 对 点 (Fibre Channel Point-to-Point): 两 个 设备 直接 连接 到 对 方 ， 这 是 最 简 
单 的 一 种 拓扑 ， 连 接 能 力 有 限 。 

仲裁 环 (Fibre Channel Arbitrated Loop): 这 种 连接 方式 中 ， 所 有 设备 连接 在 一 
个 类 似 于 令 牌 环 的 环 路 上 。 在 这 个 环 路 中 添加 或 者 移 除 一 个 设备 会 导致 环 路 上 所 有 活动 
中 断 。 环 路 上 一 个 设备 的 故障 将 导致 整个 环 路 不 能 进行 工作 。 通 过 添加 光纤 通道 集线器 
的 方法 , 能够 将 众多 设备 连接 到 一 起 ， 形 成 一 个 逻辑 上 的 环 路 ,并 且 能 够 旁 路 故障 节点 ， 
使 得 环 上 节点 的 故障 不 会 影响 整个 环 路 的 通信 。 仲 裁 环 曾经 用 于 小 型 的 SAN 环境 中 ， 但 
是 现在 已 经 不 再 使 用 ， 其 原因 在 于 一 个 仲裁 环 最 多 只 能 容纳 127 个 设备 ， 而 现在 SAN 环 
境 中 使 用 的 设备 基本 上 都 多 于 127 个 设备 。 

交换 网 络 (Fibre Channel Switched Fabric): 这 是 构建 现代 FC SAN 所 采用 的 连 
接 方式 。 它 使 用 FC 交换 机 连接 主机 和 存储 设备 。 在 现代 的 SAN 中 ， 最 好 使 用 两 个 交换 
机 来 连接 主机 和 存储 设备 ， 这 样 可 以 形成 链 路 元 余 ， 增 强 SAN 的 可 靠 性 。 

光纤 通道 既 支持 光纤 介质 ， 也 支持 铜 缆 介 质 。 由 于 光纤 介质 对 噪音 不 敏感 ， 用 它 来 
做 传输 介质 是 最 好 的 ， 比 如 光缆 具有 如 下 优点 : 可 以 达到 更 长 的 距离 、 对 电磁 干扰 不 敏 
感 、 无 电磁 辐射 、 在 设备 之 间 无 电 连接 和 无 交叉 干扰 的 问题 。 但 是 ， 铜 介质 也 得 到 了 许 
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多 的 使 用 ， 尤 其 是 对 小 型 光纤 通道 磁盘 驱动 器 的 连接 ， 原 因 在 于 与 光缆 相 比 ， 铜 缆 较 为 
便宜 。 

光缆 及 其 接 插件 也 有 多 种 不 同 的 类 型 。 用 于 长 距离 传输 的 光缆 比 用 于 短 距离 的 光线 
更 为 昂贵 。 

人 们 通常 用 模 来 区 分 光纤 类 型 。 多 模 光 纤 使 用 短波 激光 ， 其 纤 芯 直径 为 50hm 或 
62. 5hm， 包 层 直径 为 125um。 其 中 ， 纤 忆 为 光 通 路 ， 包 层 用 来 把 光线 反射 到 纤 芯 上 。 由 
于 短波 激光 流 是 由 数 百 种 模 《〈《 即 所 传输 的 光波 的 波长 ) 组 成 的 ， 它 们 在 光纤 内 以 不 同 的 
角度 发 生 全 反射 ， 因 此 称 为 多 模 。 光 的 散射 效应 限制 了 原始 信号 所 能 达到 的 总 长 度 。 从 
表 7-3 可 以 看 到 ， 多 模 光 纤 的 最 长 距离 是 500m。 

表 7-3 常用 的 光纤 连接 介质 

A 
1550nm 长 波光 激光 器 de iene 
2Gbit/s 2m 一 50km 
9hm 单 模 光 纤 1Gbit/s 2m 一 10km 
1300nm 长 波光 激光 器 2Gbit/s 2m~2km 














1Gbit/s 0. 5m 一 500m 


50hm 多 模 光 纤 2Gbit/s 0. 5m 一 300m 








Se 4Gbit/s 0. 5m 一 170m 
850nm 短波 光 激 光 器 





lGbit/s 0. 5m 一 300m 


62. 5hm 多 模 光 纤 2Gbit/s 0. 5m 一 150m 
4Gbit/s 0. 5m 一 70m 


不 管 是 光纤 介质 还 是 铜 缆 介 质 ， 光 纤 通 道 都 要 求 误 码 率 达 到 每 传递 10 ”比特 不 超过 
1 比特 错 。 这 就 意味 着 对 于 一 条 1000Mbit/s 的 连接 ， 在 全 负荷 情况 下 平均 每 16. 6 分 钟 
最 多 可 以 发 生 1 位 错 。 这 一 误 码 率 要 求 也 适用 于 光纤 通道 中 所 有 的 部 件 ， 如 ， 中 继 器 和 
交换 机 。 

如 图 7-7 所 示 ， 给 出 了 光纤 通信 的 原理 : 在 发 送 端 首先 把 要 传送 的 信息 《如 话音 ) 
变 成 电信 号 ， 然 后 调制 到 激光 器 发 出 的 激光 束 上 ， 光 的 强度 随 电 信和 号 的 幅度 〈 频 率 ) 变 
化 而 变化 ， 光 通信 利用 全 反射 原理 ， 当 光 的 注入 角 满 足 一 定 的 条 件 时 ， 光 便 能 在 光纤 内 
形成 全 反射 ， 从 而 达到 长 距离 传输 的 目的 。 基 于 光 射 线 在 纤 芯 和 包 层 界面 上 的 全 反射 ， 
使 光线 限制 在 纤 蕊 中 传输 。 如 果 光 以 一 个 不 正确 的 角度 射 到 界面 ， 光 将 离开 包 层 ， 那么 ， 
这 部 分 光 信 和 号 将 丢失 。 这 意味 着 ， 由 于 光 不 太 亮 ， 导 致 信号 微弱 ， 最 后 光电 传感器 不 能 
检测 到 。 光 纤 中 有 两 种 光线 ， 即 子午 光线 和 和 斜 射 光线 ,子午 光线 是 位 于 子午 面 上 的 光线 ， 
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而 斜 射 光线 是 不 经 过 光纤 轴线 传输 的 光线 。 









I 
sa 











py 
II 





。 nn 三 光学 介质 的 折射 率 
。 备注 :真空 的 折射 率 为 1， 空 气 中 的 折射 率 约 等 于 1 


图 7-7 光纤 传输 原理 
从 上 述 光 纤 通 信 原 理 可 知 ， 光 纤 传 输 对 线 绕 是 有 要 求 的 ， 因 此 处 理 缆 线 是 非常 重要 
的 。 例 如 一 个 工程 师 在 处 理光 纤 线 的 时 候 ， 不 能 将 光纤 线 弯曲 太 多 ， 并 且 需 要 保持 线 线 
两 端的 收发 器 没有 灰尘 。 如 图 7-8 所 示 为 光纤 线 的 最 大 弯曲 度 。 





最 小 弯曲 半径 005m (5 cm) 
图 7-8 最 大 弯曲 角度 


很 多 原因 会 导致 光 信号 的 衰减 ， 需 要 在 使 用 中 注意 。 这 些 原因 包括 : 

最 大 弯曲 度 : 最 小 弯曲 半径 为 5cm。 光 纤 路 径 的 弯曲 度 即 使 与 规格 有 微小 的 差异 ， 
也 会 导致 信号 失真 。 

最 小 弯曲 度 : 将 光纤 线 扎 得 过 紧 会 导致 信号 丢失 。 

散射 : 杂质 有 不 同 的 折射 率 。 当 光 通 过 杂质 时 ， 光 将 发 生 散 射 。 

吸收 : 当 光 以 不 合适 的 角度 射 到 包 层 时 ， 在 包 层 光 将 被 吸收 。 

光纤 收发 器 ， 通 常 又 称 为 FC 光 模 块 ， 光 纤 收 发 器 就 是 光纤 发 射 器 加 上 光纤 接收 器 ， 
它 包 含 一 个 激光 器 或 者 发 光 二 级 管 以 创建 光 脉 冲 ， 它 包含 探测 光 的 一 个 光学 传感器 ， 如 
图 7-9 所 示 。 光 纤 收 发 器 存在 于 存储 设备 ， 交 换 机 和 服务 器 HBA 卡 上 ， 可 以 单独 地 移 除 


和 更 换 。 
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图 7-9 光纤 收发 器 


主机 总 线 适配器 HBA， 一 种 能 插入 计算 机 、 服 务 器 或 大 型 主机 的 板 卡 或 集成 电路 适 
配器 ， 在 服务 器 和 存储 设备 之 间 提 供 1/0 处 理 和 物理 连接 。 光 纤 通道 HBA 卡 是 将 主机 接 
入 FC 网 络 必 不 可 少 的 设备 ， 如 图 7-10 所 示 。HBA 能 减轻 主 处 理 器 在 数据 存储 和 检索 任 
务 的 负担 ， 能 提高 服务 器 的 性 能 ; 








图 7-10 HBA 卡 


存储 设备 的 FC 接口 模块 ， 如 图 7-11 所 示 。 


rr | i = mn | 





光纤 通道 主机 端口 


图 7-11 存储 中 的 FC 接口 


7.2.5 FC 端口 


在 所 有 的 拓扑 结构 中 ， 设 备 〈 包 括 服务 器 、 存 储 设备 和 网 络 连 接 设备 ) 都 必须 配置 
一 个 或 多 个 光纤 通道 端口 。 在 服务 器 上 ， 端 口 一 般 借助 主机 总 线 适配器 实现 。 一 个 端口 
总 是 由 两 个 通道 构成 : 一 个 是 输入 通道 ， 另 一 个 是 输出 通道 。 在 两 个 端口 之 间 的 连接 称 
作 链 路 。 在 点 到 点 和 交换 网 拓扑 中 ， 链 路 总 是 双向 的 。 在 交换 网 的 情况 下 ， 链 路 所 涉及 
的 两 个 端口 的 输出 通道 和 输入 通道 通过 一 个 交叉 装置 连接 在 一 起 ， 使 得 每 一 个 输出 通道 
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都 连接 到 一 个 输入 通道 。 另 一 方面 ， 仲 裁 环 拓扑 的 链 路 是 单 向 的 ， 每 个 输出 通道 都 连接 
到 下 一 个 端口 的 输入 通道 ， 直 到 圆周 闭合 为 止 。 仲 裁 环 的 线 缆 连 接 可 以 借助 一 个 集线器 
简化 ， 形 成 星 形 环 ， 此 时 ， 端 点 设备 双向 连接 到 集线器 ， 在 集线器 内 部 的 线 缆 连接 保证 
在 仲裁 环 内 部 维持 单 向 的 数据 流 。FC 协议 通过 对 端口 标识 ， 即 端口 标识 符 进行 寻 址 并 在 
不 同 设备 间 互 联 时 定义 了 不 同 的 接口 类 型 。 

如 图 7-12 所 示 ， 根 据 不 同 的 功能 ， 如 自 适应 式 管 理 员 设 定 可 以 将 FC 端口 分 为 以 下 
几 种 类 型 。 





图 7-12 FC 协议 端口 定义 


N 端口 〈 结 点 端口 ): 光纤 通道 通信 是 围绕 N 端口 和 下 端口 开发 的 ， 这 里 的 N 表示 
Node〔 结 点 ), F 表示 Fabrie〔 交 换 网 )。N 端口 描述 一 个 端点 设备 (服务 器 ， 存 储 设备 )， 
也 称 结 点 ， 具 有 加 入 交换 网 拓扑 或 点 到 点 拓扑 的 能 力 。 

F 端口 (交换 端口 ): F 端口 是 N 端口 在 光纤 通道 交换 机 中 的 对 接点 。F 端口 知道 怎 
样 把 一 个 N 端 口 发 送 给 它 的 帧 通过 光纤 通道 网 络 传递 给 所 目标 端点 设备 。 

NL 端口 〈 结 点 和 环 端口 ): NL 端口 同时 具有 N 端口 和 L 端口 的 能 力 。 一 个 NL 端口 
既 可 以 连 到 一 个 交换 网 ， 也 可 以 连 到 一 个 仲裁 环 。 | 

FL 端口 (交换 网 环 端口 );， 交换 机 的 FL 端口 允许 把 一 个 交换 网 连接 到 一 个 仲裁 环 。 
FL、NL 和 L 端口 都 可 以 用 来 构成 仲裁 环 。 

E 端口 (扩展 端口 )， 两 个 光纤 通道 交换 机 通过 EE 端口 连接 在 一 起 。E 端口 使 得 连接 
到 两 个 不 同 交换 机 的 端点 设备 可 以 互 传 数据 。 光 纤 通 道 交 换 机 通过 E 端口 在 整个 光纤 通 
道 网 络 上 中 转 信息 。 

G 端口 (通用 端口 ): 现代 光纤 通道 交换 机 具有 一 些 可 以 自动 地 配置 的 通用 端口 ， 即 
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6 端口 。 例 如 ， 如 果 一 个 光纤 通道 交换 机 通过 一 个 G 端口 连接 到 另 一 个 光纤 通道 交换 机 ， 
那么 G 端口 就 把 它 自 己 配置 成 一 个 上 端口 。 

在 一 个 光纤 网 络 环境 中 ， 可 能 会 有 成 千 上 万 的 组 件 ， 所 以 必须 用 一 个 唯一 的 标识 符 
来 识别 每 一 个 设备 。 光 纤 通 道 使 用 的 标识 符 是 全 球 唯 一 名 称 (World Wide Name，WWN)。 
光纤 网 络 里 ， 每 一 个 设备 〈 包 括 光 纤 通 道 兼容 的 设备 ) 的 唯一 标识 就 是 WN， 用 于 标识 存 
储 设备 中 1/0 模块 的 单个 接口 。 如 图 7-13 所 示 ，WWN 有 2 种 不 同 的 定义 : WWNN 和 WWPN。 





se P2P 
光纤 网 络 eFC_AL 
* FC-SW 










WWPN 


全 球 唯一 节点 号 (World Wide Node Number，WWNN) 是 分 配给 每 一 个 上 层 节点 的 一 
个 全 球 唯一 的 64 位 标识 符 。 一 个 WWNN 被 分 配给 一 个 接 光 纤 通 道 网 络 中 的 节点 。 一 个 HBA 
卡 上 的 所 有 端口 共享 一 个 WWNN,， 即 , WWNN 可 以 被 属于 同一 个 节点 的 一 个 或 者 多 个 不 同 的 
端口 〈 每 个 端口 拥有 不 同 的 WWPN， 并 且 属 于 同一 个 节点 ) 共同 使 用 。 

全 球 唯 一 端口 号 (World Wide Port Number，WWPN) 是 分 配给 每 一 个 光纤 通道 端口 
的 一 个 唯一 的 64 位 标示 符 。 每 个 WWPN 被 该 端口 独 享 ，WWPN 在 存储 区 域 网 络 中 的 应 用 就 
等 同 于 MAC 地 址 在 以 太 网 协议 中 的 应 用 。 

WWN 命名 规则 一 般 是 8 对 十 六 进 制 数值 ， 共 64 字 节 ; 每 对 十 六 进 制 数 值 之 间 以 冒号 隔 
开 。 在 ISO/IEC 14165-252 (FC-FS-2) 标准 中 定义 了 WWN 的 几 种 格式 ， 比 较 常见 的 几 种 是 : 

10:00:00:00:C9:B7:1B:A6 

20:34:00:A0:B8:32:5D:72 

50:05:07:68:02:10:36:2A 

GCOS80:76:00:35:BT:01:26 

根据 标准 ， 首 部 的 十 六 进 制 数 值 ( 即 NAA 位 ，Network Address Authority) 决定 的 
WWN 采用 的 具体 格式 ， 参 考 表 7-4。 

表 7-4 光纤 协议 标识 表 

NAA TEEE 48-bit 


NAA IEEE Registered Extended 6h 16 bytes 
Ch, Dh, Eh, Fh 8 bytes 


NAA EUI-64 Mapped 


图 7-13 WWNN 和 WWPN 表示 
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如 图 7-14 所 示 ， 给 出 一 个 WIN 解析 例子 。 在 WWN 中 ， 用 一 个 十 六 进 制 字符 表示 一 
个 4 位 的 字符 , 16 个 十 六 进 制 字符 可 以 表示 64 位 的 标识 符 , 以 “20:00:00:60:69:00:60:02” 
为 例 ，20:00 是 FC 标准 预 留 ，00:60:69 是 由 电气 和 电子 工程 师 协 会 (Institute of 
Electrical and Electronics Engineers，IEEE) 指定 给 制造 商 ， 在 制造 时 被 直接 内 置 
到 设备 中 去 的 ，00:60:02 是 生产 厂商 定义 的 。 单 端口 FC HBA 卡 上 的 WWNN 和 WWPN 相同 ， 
但 多 端口 FC HBA 卡 或 FC 交换 机 上 的 WWNN 和 WWPN 不 同 。 


FC 标准 预 留 。 ”IEEE 定义 生产 厂商 定义 


Ee 刁 忆 3 


生产 厂商 选择 的 16 进 制 字符 
。 使 用 的 设备 : 交换 机 ,磁带 机 , 磁带 库 ，HBA 卡 


Er 国 F 大 


生产 厂商 选择 的 16 进 制 字符 
。 使 用 的 设备 有 一 个 或 多 个 端口 : 交换 机 , 磁带 . 磁带 库 ，HBA 卡 
图 7-14 WWN 解析 


7.2.6 FC 分 区 (zone ) 的 概念 


光纤 通道 协议 提供 有 安全 机 制 ， 比 如 它 支 持 分 区 〈Zone) 功能 ， 可 以 规定 不 同 分 区 
的 设备 能 否 交互 。 一 个 设备 节点 或 WWN 处 于 单独 的 分 区 , 也 可 以 同时 处 于 多 个 分 区 之 中 。 
FC 分 区 有 两 种 类 型 的 分 区 : 软 分 区 和 硬 分 区 ， 如 图 7-15 所 示 。 





图 7-15 Zone 分 区 
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软 分 区 意味 着 交换 机 将 设备 的 WN 分 配 到 一 个 区 之 中 ,这 和 设备 所 连接 的 端口 无 关 。 
例如 ， 如 果 Q 和 Zz 在 同一 个 软 分 区 内 ， 它 们 就 能 够 彼此 交谈 。 同 理 ， 如 果 Z 和 A 处 于 男 
一 个 软 分 区 之 中 ， 此 时 ，A 和 7Z 就 能 够 看 到 对 方 , 但 是 A 看 不 到 Q。 软 分 区 要 依赖 光纤 通 
道中 节点 的 WN。 通 过 使 用 软 分 区 ， 可 以 连接 交换 机 上 的 任何 端口 ， 可 以 看 到 应 该 看 到 
的 其 他 节点 。 

硬 分 区 和 以 太 网 里 的 VLAN 类 似 。 当 一 个 端口 被 分 配 到 一 个 分 区 里 ， 任 何 连接 到 这 
个 端口 的 设备 都 属于 这 个 分 区 。 为 了 防止 有 人 破坏 光纤 连接 , 在 交换 机 上 进行 硬 分 区 时 ， 
将 WN 和 目标 上 的 LUN 地 址 绑 定 。 通 过 使 用 存储 阵列 的 WWN masking， 多 个 Initiator 
都 能 够 看 到 这 个 Target。 


7.3 IP SAN 


7.3.1 IP SAN 概念 


早期 SAN 网 络 采用 光纤 通道 进行 块 数据 传输 ， 因 此 早期 SAN 指 的 是 FC SAN。 在 实际 
应 用 中 ， 如 果 企 业 要 使 用 SAN 网 路 进行 数据 存储 ， 需 要 购买 FC SAN 存储 网 络 相关 的 设备 
组 件 ， 其 昂贵 的 价格 和 复杂 的 配置 限制 了 中 小 型 企业 ， 尤 其 是 小 型 企业 的 部 署 使 用 。 因 
此 ， 为 了 提高 SAN 存储 网 络 的 使 用 ， 满 足 中 小 型 企业 的 需求 ， 工 程 师 们 提出 并 设计 了 IP 
SAN 方案 。 

IP SAN 指 基 于 IP 协议 传输 的 网 络 存储 系统 ， 其 使 用 标准 的 TCP/IP 协议 ， 可 在 
以 太 网 上 进行 块 数据 的 传输 ， 无 需 配 置 专门 的 FC 网 络 。 图 7-16 所 示 为 IP SAN 的 拓 


扑 结构 。 
a 了 a a 


LAN 





存储 设备 以 太 网 交换 机 存储 设备 


图 7-16 ”IP SAN 网 络 
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7.3.2 IP SAN 网 络 架构 的 优 缺 点 


IP SAN 具有 如 下 优点 。 

接 入 标准 化 : IP SAN 的 部 署 不 需要 专用 的 光纤 HBA 卡 和 光纤 交换 机 ， 可 直接 利用 现 
有 网 络 中 的 以 太 网 卡 和 以 太 网 交换 机 ; 

传输 距离 远 : 只 要 IP 网 络 可 达 的 地 方 ， 就 可 以 部 署 IP SAN 存储 网 络 ; 

可 维护 性 好 :IP 网络 的 维护 工具 非常 发 达 ， 具 有 较 多 的 专业 技术 人 员 支 持 ; 

带宽 扩展 方便 : iSCSI 承载 于 以 太 网 ， 现 以 太 网 已 经 发 展 10Gbit/s 速率 ，40Gbit/s 
也 在 研发 中 ; 

成 本 低 : 整体 降低 产品 的 总 体 拥有 成 本 TC0。 

IP SAN 的 缺点 如 下 。 

数据 安全 性 : 数据 在 IP SAN 网 络 中 传输 时 ， 尽 管 IP 协议 可 以 应 用 IPSec 以 保障 数 
据 的 安全 性 ， 但 也 只 能 提供 数据 在 网 络 传输 过 程 的 动态 安全 性 ， 并 不 能 保证 数据 被 保存 
在 存储 设备 上 的 静态 安全 性 。 另 外 ， 使 用 IP 网 络 构建 的 IP SAN 和 传统 的 IP 业务 很 难 从 
物理 上 完全 隔离 ， 而 IP 网 络 是 开放 式 网 络 ， 仍 然 存在 众多 安全 漏洞 ， 这 对 IP SAN 也 构 
成 安全 性 威胁 ; 

TCP 负载 空闲 引擎: 由 于 IP 协议 是 无 连接 不 可 靠 的 传输 协议 ， 数 据 的 可 靠 性 和 完整 
性 是 由 TCP 协议 来 提供 的 ， 而 TCP 为 了 完成 数据 的 排序 工作 需要 占用 较 多 的 主机 CPU 资 
源 ， 导 致 用 户 业 务 处 理 延 退 的 增加 。 

占用 IP 网 络 资源 : 由 于 IP SAN 是 直接 部 署 在 现 有 的 网 络 资源 上 ， 而 IP 网 络 尤其 
是 以 太 网 络 的 效率 和 QoS 都 较 低 ， 因 此 IP SAN 网 络 将 占用 系统 资源 。 


7.3.3 IP SAN 组 网 形式 


1， 直 连 组 网 

主机 与 存储 设备 之 间 直 接 通过 以 太 网 卡 、TOE 卡 或 iSCSI HBA 卡 连 接 ， 如 图 7-17 
所 示 。 

直 连 组 网 方式 具有 构建 简单 、 经 济 省 钱 的 优点 ， 但 存在 主机 存储 资源 分 享 比较 困难 
的 问题 。 

2.， 单 交换 组 网 

主机 与 存储 设备 之 间 通 过 一 台 以 太 网 交换 机 进行 通信 , 同时 主机 安装 以 太 网 卡 、TOE 
卡 或 iSCSI HBA 卡 实 现 连接 ， 如 图 7-18 所 示 。 

单 交 换 组 网 结构 使 多 台 主 机 能 共同 分 享 同一 台 存 储 设备 ， 扩 展 性 强 ， 但 存在 单 点 故 
障 问题 。 
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应 用 服务 器 应 用 服务 器 


| 以 太 网 交换 机 





存储 设备 存储 设备 
图 7-17 直 连 组 网 图 7-18 ” 单 交换 组 网 
3.， 双 交换 组 网 
主机 与 存储 设备 之 间 通 过 两 台 以 太 网 交换 机 进行 通信 , 同时 主机 安装 以 太 网 卡 、TOE 
上 或 iSCSI HBA 卡 实现 连接 , 如 图 7-19 所 示 。 同 一 台 主 机 到 存储 设备 端 由 多 条 路 径 连接 ， 
可 靠 性 强 ， 避 免 了 在 单 交换 组 网 中 以 太 网 交换 机 处 存在 的 单 点 故障 。 


应 用 服务 器 应 用 服务 器 
2 这 
7 、 
| J 

\ 
、、 ”以太 网 交换 机 以 太 网 交换 机 一 


gr 


图 7-19 双 交 换 组 网 


7.3.4 FC SAN 和 IPSAN 对 比 


下 面 从 网 络 速度 、 网 络 架 构 、 传 输 距 离 、 管 理 维护 、 兼 容 性 、 性 能 、 成 本 、 容 灾 、 
安全 性 等 方面 对 FC SAN 和 IP SAN 进行 分 析 和 对 比 ”。 

网 络 速 度 : FC SAN 支持 4Gbit/s、8Gbit/s、16Gbit/s; IP SAN 支持 1Gbit/s、10Gbit/s。 

网 络 架 构 : FC SAN 需要 单独 建设 光纤 网 络 和 HBA 卡 ; IP SAN 可 直接 使 用 现 有 IP 网 络 。 
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传输 距离 ，FC SAN 的 传输 距离 受到 光纤 传输 距离 的 限制 ，IP SAN 理论 上 没有 距离 
限制 ， 只 要 IP 网 络 可 达 的 地 方 ， 都 能 部 署 。 

管理 维护 ，FC SAN 技术 和 管理 较 复杂 ; IP SAN 的 管理 维护 与 IP 设备 一 样 操作 简单 。 

兼容 性 :FC SAN 的 兼容 性 差 ，IP SAN 与 所 有 IP 网 络 设备 都 兼容 。 

性 能 :FC SAN 具有 非常 高 的 传输 和 读 写 性 能 ，IP SAN 目前 主流 16B，106B 正在 发 展 。 

成 本 : FC SAN 网 络 的 搭建 需要 购买 光纤 交换 机 、HBA 卡 、 光 纤 磁 盘 阵 列 等 、 同 时 需 
要 培训 人 员 、 系 统 设置 与 监测 等 ， 成 本 高 ，IP SAN 购买 与 维护 成 本 都 较 低 ， 有 更 高 的 投 
资 收益 比例 。 

容 灾 : FC SAN 搭建 容 灾 的 硬件 、 软 件 成 本 都 比较 高 ，IP SAN 本 身 可 以 实现 本 地 和 
异地 容 灾 ， 且 成 本 低 。 

安全 性 : FC SAN 和 传统 业务 IP 网 络 从 物理 上 隔离 ， 保 证 了 SAN 网 络 下 传输 和 存储 
的 数据 安全 性 ，IP SAN 网 络 中 ， 尽 管 IP 协议 可 以 应 用 IPSec 以 保障 数据 的 安全 性 ， 但 
只 能 提供 数据 在 网 络 传输 过 程 的 动态 安全 性 ， 并 不 能 保证 数据 在 存储 设备 上 的 静态 安全 
性 。 由 于 IP 网 络 是 开放 式 网 络 ， 仍 然 存 在 众多 安全 漏洞 ， 这 对 于 使 用 传统 IP 网 络 构建 
的 了 P SAN 是 一 个 安全 威胁 。 


7.3.5 iSCSI 协议 栈 


如 图 7-20 所 示 ，iSCSI 是 层次 协议 ，iSCSI 节点 将 SCSI 指令 ( 即 ， 命 令 描 述 符 块 
CDB) 和 数据 封装 成 iSCSI 包 ( 即 , 协议 数据 单元 PDU) 后 传送 给 TCP/IP 层 , 再 由 TCP/IP 
协议 将 iSCSI 包 封 装 成 IP 协议 数据 ， 然 后 发 送 到 以 太 网 上 进行 传输 。 


1-SCSI 用 户 数据 2-SCST 层 





图 7-20 iSCSI 协议 层 


所 有 的 SCSI 命令 都 被 封装 成 iSCSI 协议 数据 单元 (PDU)， 利 用 TCP/IP 协议 栈 中 传 
输 层 的 TCP 协议 封装 TCP/TP 数据 包 , 提供 可 靠 的 传输 机 制 。 传 输 帧 结构 如 网 7-21 所 示 。 

iSCSI 架构 是 基于 C/S 模型 进行 数据 传输 的 。 在 iSCSI 系统 中 , 用户 在 一 台 SCSI 存 
储 设 备 上 发 出 I/0 请 求 ， 操 作 系 统 对 该 请 求 进行 处 理 ， 并 将 该 请 求 转换 成 SCSI 指令 ,再 
传 给 目标 SCSI 控制 卡 。iSCSI 节点 将 指令 和 数据 封装 形成 一 个 iSCSI 包 ， 然 后 将 数据 单 
元 传送 给 TCP/TIP 层 ， 由 TCP/IP 协议 将 iSCSI 包 封 装 成 IP 协议 数据 , 以 适合 在 网 络 中 传 
输 。 此 过 程 也 可 以 对 封装 的 SCSI 命令 进行 加 密 处 理 , 以 保证 在 不 安全 的 网 络 土 传送 的 安 
全 性 。 有 具体 传输 如 图 7-22 所 示 。 
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图 7-21 传输 帧 结构 


i 
iSCSI IP 网 络 
Initiator 有 
eg 





图 7-22 iSCSI 传输 示意 图 


由 于 iSCSI 的 通信 体系 仍然 继承 了 SCSI 的 部 分 特性 ， 因 此 在 iSCSI 通信 中 ， 需 要 
一 个 发 起 I/0 请 求 的 启动 器 (Initiator) 和 一 个 响应 并 执行 实际 I/0 操作 的 目标 器 
(Target)。 在 Initiator 和 Target 建立 连接 后 , Target initiator target 
在 操作 中 作为 主 设备 控制 整个 工作 过 程 。 

iSCSI 具体 的 传输 过 程 如 图 7-23 所 示 。 

发 起 端 (Initiator): SCSI 层 负责 生成 命令 描述 符 
块 CDB， 将 CDB 传 给 iSCSI 层 ，iSCSI 层 负责 生成 iSCSI 
协议 数据 单元 PDU， 并 通过 IP 网 络 将 PDU 发 给 Target。 
发 起 端 可 以 是 软件 Initiator 驱动 程序 ， 硬 件 的 TOE 网 
卡 ， 或 者 是 iSCSI HBA 卡 。 

目标 器 (Target ): 与 发 起 端的 处 理 流程 相反 ,Target 
端点 通过 TCP/IP 收 到 iSCSI PDU 后 ， 执 行 解 封 装 操作 ， 
并 将 解 封 后 的 CDB 传 给 SCSI 层 ，SCSI 层 负责 解释 CDB 
的 意义 ， 必 要 时 发 送 响应 。 目 标 器 可 以 是 磁盘 阵列 、 服 务 网 上 硬盘 或 磁带 库 。 





图 7-23 iSCSI 传输 过 程 


一 5 一 


数据 存储 技术 





7.3.6 iSCSI 存储 设备 与 主机 连接 方式 


实现 IP SAN 的 典型 协议 是 iSCSI， 它 定义 了 SCSI 指令 集 在 IP 网 络 中 传输 的 封装 方 
式 。iSCSI (Internet SCST) 是 IEIF 在 2003 年 制定 的 一 项 标准 ，iSCSI 协议 是 建立 在 
SCSI 协议 和 TCPVIP 协议 基础 上 的 标准 化 协议 ， 用 于 将 SCSI 数据 块 封装 成 IP 数据 包 ， 
并 在 以 太 网 中 传输 。 

iSCSI 设备 一 般 采 用 IP 接口 作为 主机 接口 ， 连 接 到 以 太 网 交换 机 ， 构 建 一 个 基于 
TCP/IP 协议 的 IP SAN 存储 网 络 ”“ 。 根 据 主 机 端 所 采用 的 不 同 连接 方式 ，iSCSI 设备 
与 主机 的 连接 有 三 种 形式 。 

1。NIC+Initiator 软件 

如 图 7-24 所 示 ， 主 机 使 用 标准 的 以 太 网 卡 〈NIC) 与 网 络 连接 。 由 主机 Initiator 
软件 完成 iSCSI 报 文 到 TCP/IP 报 文 转换 。NICrInitiator 软件 的 方式 直接 使 用 传统 主机 
系统 通用 的 NIC 卡 ， 其 成 本 最 低 。 但 由 于 iSCSI 协议 和 TCP/IP 协议 处 理 需 要 占用 主机 
CPU 资源 ， 降 低 了 主机 系统 性 能 。 





图 7-24 NIC+Initiator 软件 


2. TOE+Initiator 软件 

如 图 7-25 所 示 ， 在 TOE+Initiator 软件 方式 下 ， 主 机 使 用 TCP 卸载 引擎 TOE) 来 
专门 处 理 TCP/IP 协议 转换 ,而 iSCSI 报 文 的 转换 由 主机 的 CPU 实现 , 与 NIC+ Initiator 
软件 的 方式 相 比 ，TOE+Initiator 软件 将 主机 CPU 实现 TCP 协议 处 理 功 能 下 放 给 TOE 网 
卡 ， 降 低 了 主机 的 运行 开销 ， 同 时 提高 了 数据 的 传输 速率 。 
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图 7-25 TOE+Initiator 软件 


3. iSCSI HBA 

如 图 7-26 所 示 ， 在 主机 上 安装 一 个 iSCSI HBA 卡 ，iSCSI HBA 卡 完成 iSCSI 报 文 转 
换 和 TCP/IP 报 文 转换 功能 ， 最 大 限度 释放 主机 CPU 资源 ， 使 得 IP SAN 操作 对 主机 的 开 
销 占用 最 小 ， 相 比 上 述 两 种 实现 方式 ，iSCSI HBA 方式 能 获得 最 好 的 传输 性 能 。 而 iSCSI 
HBA 方式 的 代价 是 系统 构建 成 本 高 。 


| iSCSI 报 文 到 TCP/IP 报 文 
iSCSI HBA 转换 ， 完 全 不 | 


基于 TCP/IP 协议 的 
以 太 网 连接 
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存储 设备 
图 7-26 iSCSI HBA 方式 
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7.3.7 iSCSI 应 用 场景 


iSCSI 构建 的 IP SAN 存储 网 络 广 受 中 小 企业 的 欢迎 ， 因 为 中 小 企业 大 都 以 TCP/IP 
协议 为 基础 构建 网 络 环境 ，iSCSI 可 以 直接 部 署 在 IP 网 络 上 ， 降 低 搭建 成 本 。 

基于 iSCSI 存储 技术 的 IP 存储 主要 用 于 解决 远程 存储 问题 ， 实 现 异地 间 的 数据 传 
输 ， 两 个 典型 的 iSCSI 应 用 场景 是 异地 数据 交换 和 异地 数据 备份 。 

华为 大 多 数 的 存储 设备 都 支持 iSCSI 协议 。 以 0ceanStor S5500 存储 阵列 为 例 ， 其 
支持 两 种 不 同 传输 性 能 的 iSCSI 接口 模块 ， 包 括 1Gbit/s 和 10Gbit/s。 

1) 1Gbit/s iSCSI 接口 模块 提供 了 存储 设备 接收 应 用 服务 器 读 写 请 求 的 服务 。 每 一 
个 1 Gb/s iSCSI 接口 模块 有 4 个 端口 用 于 接收 应 用 服务 器 发 出 的 数据 交换 命令 ; 

2) 10Gbit/s TOE 接口 模块 提供 了 存储 设备 接收 应 用 服务 器 读 写 请 求 的 服务 。 每 一 
个 10 Gb/s TOE 接口 模块 有 4 个 端口 用 于 接收 应 用 服务 器 发 出 的 数据 交换 命令 。 

OceanStor S5500 存储 阵列 的 两 种 iSCSI 接口 模块 如 图 7-27 所 示 。 















iSCSI 端口 速率 指示 类 | 上 


| 10Gbit/s TOE 端口 
1Gbits iSCSI 端口 


td 


1 GbETH 10 Gb ETH 
图 7-27 0ceanStor S5500 存储 阵列 及 两 种 iSCSI 模块 


7.4 FCoE 


以 太 网 光纤 通道 (Fibre Channe] over Ethernet，FCoE) 是 由 美国 国家 标准 委员 
会 CANSI) 定义 的 一 种 融合 网 络 技术 ， 是 以 光纤 通道 FC 存储 协议 为 核心 的 I/0 整合 方 
案 。FCoE 是 将 FC 帧 封装 到 以 太 网 帧 中 ， 以 实现 在 以 太 网 基础 设施 上 传输 光纤 信道 信号 
的 功能 。 
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7.4.1 FCoE 产生 背景 


通常 情况 下 ， 数 据 中 心 运行 的 网 络 包括 前 端 业 务 网 络 和 后 端 存储 网 络 ， 前 端 业务 网 
络 通常 是 以 太 网 网 络 〈Ethernet)， 用 于 客户 端 到 服务 器 、 服 务 器 到 服务 器 的 通信 ; 后 端 
存储 网 络 可 以 是 FC SAN， 也 可 以 是 IP SAN， 用 于 服务 器 和 存储 设备 、 存 储 设备 和 存储 设 
备 之 间 的 通信 。 一 个 数据 中 心 运行 多 个 独立 的 网 络 ， 服 务 器 需要 为 每 种 网 络 配置 单独 的 接 
口 ， 包 括 连接 以 太 网 的 网 络 接口 卡 〈NIC) 和 连接 光纤 通道 网 络 的 主机 总 线 适 配器 CHBA)。 

多 个 独立 网 络 并 存 的 设计 方案 满足 了 数据 中 心 的 性 能 追求 ， 同 时 也 带 来 了 一 系列 问 
题 : 首先 ， 数 据 中 心服 务 器 需 为 每 种 网 络 专门 配置 一 块 甚至 多 块 HBA 卡 ， 每 种 网 络 需 要 
部 署 专用 的 交换 机 、 线 线 等 硬件 设备 ， 投 资 成 本 高 ;其 次 ， 多 个 网 络 相互 独 立 ， 彼 此 隔 
离 ， 管 理 维护 过 程 复 杂 ， 需 要 更 多 的 人 员 运 行 维护 ， 增 加 了 人 才 培 养 成 本 投入 ; 再 者 ， 
服务 器 部 署 难度 大 ， 多 物理 接口 卡 造成 软 硬 件 之 间 藉 合 性 强 ， 削 弱 了 业务 灵活 性 ， 造 成 
业务 迁移 复杂 、 困 难 ; 此 外 ， 存 储 网 络 和 业务 网 络 相互 独立 这 种 设计 方式 ， 难 以 充分 利 
用 以 太 网 的 扩展 性 的 同时 保留 光纤 通道 的 高 可 靠 性 和 高 效率 ， 同 时 ， 相 隔 甚 远 的 两 个 存 
储 局 域 网 也 难以 通信 交互 。 

FC 通道 和 以 太 网 各 有 其 优势 ， 加 之 以 太 网 迅速 发 展 ， 人 们 自然 想到 把 两 种 网 络 相 融 
合 ， 于 是 工程 师 提 出 了 FCoE 的 设计 构想 ， 即 ， 将 FC 帧 封装 到 以 太 网 帧 中 借助 以 太 网 链 路 
进行 传输 。FCoE 技术 的 产生 ， 极 大 程度 上 降低 数据 中 心 基础 设施 和 运行 维护 的 投资 成 本 ， 
实现 了 数据 中 心 在 以 太 网 和 FC 基础 设施 的 无 颖 互通 ， 使 用 户 享受 融合 网 络 带 来 的 优势 。 

FCoE 协议 是 指 在 增强 型 以 太 网 基础 设施 上 传输 光纤 信道 信号 功能 的 规范 , 它 目前 已 
被 大 部 分 网 络 和 存储 供应 商 支持 ,包括 Brocade、IBM、HP、EMC、NetApp、Cisco 等 厂商 ， 
并 且 通 过 了 美国 国家 标准 委员 会 (ANSI) 的 审批 , 被 收录 到 新 的 FC-BB-5 (Fibre Channel 
Backbone Generation 5) 标准 中 所。FCoE 将 光纤 通道 协议 映射 到 以 太 网 上 ， 这 是 一 个 
独立 的 以 太 网 转发 协议 ， 被 视 为 极 具 应 用 前 景 的 新 一 代 存储 区 域 网 协议 ”。 

当 一 个 生产 系统 的 前 端 业务 网 和 后 端 存储 网 络 融合 后 , 存储 网 络 和 以 太 网 可 共享 同一 
个 单一 的 、 集 成 的 网 络 基础 设施 ， 实 现 不 同类 型 网 络 的 共存 和 网 络 基础 设施 精简 整合 的 目 
标 ; 但 是 ， 也 带 来 了 新 的 问题 。 本 小 节 主 要 针对 FCoE 的 优点 及 其 面临 的 挑战 加 以 阐述 。 

优点 一 : 精简 网 络 结构 ， 增 强 业 务 灵 活性 

存储 网 络 (SAN) 和 业务 网 络 CLAN) 分 开 部 署 的 情况 下 ， 组 网 比较 复杂 ， 如 图 7-28 
所 示 。 当 现 有 LAN 网 络 中 的 主机 需要 增加 FC SAN 进行 存储 连接 时 , 必须 对 主机 进行 停机 ， 
以 男 外 部 署 FC 交换 机 、 光 纤 线 缆 以 及 在 主机 上 安装 FC HBA 卡 ， 这 种 双重 组 网 部 署 结构 
相对 复杂 而 且 增加 了 网 络 管理 难度 。 由 于 两 种 网 络 相互 独立 ， 业 务 运 作 时 主机 需要 通过 
不 同 的 网 络 进行 客户 端的 交互 和 存储 的 访问 ， 对 于 没有 接 入 存储 网 络 的 主机 而 言 ， 无 法 
访问 到 SAN 中 存储 设备 ， 业 务 灵 活性 收 到 了 一 定 的 限制 。 
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图 7-28 业务 网 和 存储 网 独立 部 署 

而 在 SAN 和 LAN 网 络 融合 部 署 的 情况 下 ， 组 网 结构 相对 简单 ， 如 图 7-29 所 示 。 当 
现 有 LAN 网 络 中 的 主机 需要 进行 存储 连接 时 ， 直 接 通 过 FCoE 交换 机 将 流量 发 送 给 SAN 
中 的 存储 阵列 即 可 ; 与 此 同时 ,基于 以 太 网 的 业务 数据 同样 可 以 通过 FCoE 交换 机 传送 至 
LAN 上 的 客户 端 。 由 此 可 见 ，FCoE 组 网 的 部 署 简化 了 生产 系统 的 组 网 结构 ， 不 仅 网 络 设 
备 数量 减少 ,而 且 管理 和 维护 也 变 得 方便 。 此 外 ， 原 本 以 太 网 和 FC 网 络 领域 的 架构 依然 
可 以 延续 ， 连 入 融合 网 络 中 的 所 有 的 服务 器 ， 既 能 与 客户 端 交 互通 信 ， 又 能 访问 存储 设 
备 ， 特 别 是 在 虚拟 机 迁移 的 应 用 场景 下 ， 可 为 虚拟 机 提供 一 致 的 存储 连接 ， 提 高 了 系统 
的 灵活 性 和 可 用 性 ， 增 强 的 业务 灵活 性 。 





图 7=29 FCoE 典型 组 网 
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FCoE 交换 机 包含 有 传统 的 FC 模块 与 接口 、 增 强 型 以 太 网 接口 ， 可 以 实现 传统 以 太 
网 设备 、 传 统 FC 设备 和 FCoE 设备 之 间 的 交互 通信 。FCoE 卡 也 叫 CNA 卡 ， 即 硬 FCoE HBA 
卡 ， 是 FC HBA 卡 和 以 太 网 卡 的 融合 网 卡 ， 通 过 卡 上 的 控制 芯片 ， 可 以 实现 FCoE 协议 、 
FC 协议 和 以 太 网 协议 的 处 理 。 

优点 二 : 节约 资源 ， 降 低 成 本 

LAN 和 SAN 网 络 通过 FCoE 技术 共享 网 络 资源 ， 更 有 效 地 整合 和 利用 分 散 的 资源 。 双 
重 网 络 分 开 部 署 情况 下 ， 需 要 投入 以 太 网 卡 、 以 太 网 线 缆 、 以 太 网 交换 机 、FC HBA 卡 、 
FC 线 缆 和 FC 交换 机 ， 所 有 的 网 络 设备 都 要 双重 部 署 ， 而 利用 FCoE 技术 进行 融合 网 络 部 
署 情况 下 ， 只 需 投 入 FCoE 卡 、FCoE 交换 机 和 以 太 网 线 缆 即 可 。 网 络 的 融合 不 仅 减少 网 
络 基础 设施 的 投资 ， 而 且 简化 了 网 络 复杂 度 ， 降 低 网 络 的 管理 和 维护 成 本 ; 同时 ， 服 务 
器 采用 融合 网 络 适配器 ， 一定 程度 上 减少 生产 系统 的 电力 和 冷却 成 本 ; FCoE 可 以 和 现 有 
的 以 太 网 及 FC 基础 设施 无 颖 互通 ， 现 有 网 络 设施 投资 得 到 了 保护 。 

优点 三 :兼备 以 太 网 的 扩展 性 ， 保 留 光纤 通道 的 高 可 靠 性 

FCoE 技术 实现 了 在 增强 型 以 太 网 基础 设施 上 传输 光纤 信道 信号 的 功能 , 获得 了 光纤 
通道 存储 网 络 所 具有 的 高 性 能 和 高 可 靠 性 优势 ， 达 到 了 将 存储 网 络 融 入 以 太 网 架构 的 目 
标 。FCoE 依然 可 以 提供 标准 的 光纤 通道 原 有 的 多 种 服务 ,而 且 这 些 服务 都 可 以 按照 原 有 
标准 运作 , 保有 FC 网 络 的 低 延 迟 性 、 高 性 能 和 高 可 靠 性 等 特点 ， 为 服务 器 提供 访问 存储 
设备 的 后 端 存储 网 络 。FCoE 采用 增强 型 以 太 网 作为 物理 网 络 传输 通道 ， 可 以 传输 以 太 网 
数据 帧 , 可 以 为 前 端的 业务 提供 数据 传输 通道 FCoE 并 不 是 要 代替 传统 的 光纤 通道 技术 ， 
而 是 对 光纤 通道 进行 拓展 。 图 7-30 所 示 为 多 台 FCoE 交换 机 时 的 组 网 情况 。 





图 7-30 多 FCoE 交换 机 的 典型 组 网 
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扩展 性 :FCoE 技术 将 FC 帧 封装 在 以 太 网 帧 中 ， 承 载 在 以 太 网 二 层 链 路 上 ， 实 现 了 
两 个 相隔 甚 远 的 存储 区 域 网 络 的 互通 ， 让 业务 主机 可 以 访问 到 距离 更 远 的 存储 设备 ， 极 
大 地 提高 了 存储 区 域 网 络 的 扩展 性 能 , 理论 上 遍布 世界 各 地 的 IP 网 络 可 达 之 处 , 存储 网 
络 便 可 达 。 

可 靠 性 : FC 协议 不 允许 出 现 丢 包 ， 而 以 太 网 是 可 以 容忍 网 络 丢 包 ， 那 么 FCoE 借助 
现 有 普通 以 太 网 链 路 来 传输 FC 帧 , 是 存在 网 络 丢 包 现象 的 , 因此 需要 对 以 太 网 做 一 定 的 
增强 来 避免 琉 包 。 融 合 增强 型 以 太 网 (Converged Enhanced Ethernet，CEE) 作为 FCoE 
物理 网 络 传输 架构 , 不 仅 能 够 提供 标准 的 光纤 通道 有 效 内 容 载荷 ， 避 免 类 似 TCP/IP 协议 
的 开销 和 数据 包 损失 ， 而 且 通 过 基于 优先 级 的 流量 控制 、 增 强 传输 选择 和 拥塞 通告 ， 达 
到 FCoE 对 以 太 网 提出 的 无 丢 包 要 求 。 

基于 优先 级 的 流量 控制 (Priority-based Flow Control，PFC) 是 对 以 太 网 Pause 
机 制 的 一 种 增强 ， 以 太 网 Pause 机 制 能 够 实现 网 络 不 丢 包 的 要 求 ， 但 它 会 阻止 一 条 链 路 
上 的 所 有 流量 。 如 图 7-31 所 示 ，PFC 可 以 在 一 条 以 太 网 物理 链 路 上 创建 多 个 独立 的 虚拟 
链 路 ， 并 允许 暂停 和 重启 其 中 任意 一 条 虚拟 链 路 ， 通 过 对 单个 虚拟 链 路 创建 无 丢 包 类 别 
的 服务 供 FCoE 使 用 ， 实 现 同一 物理 链 路 上 多 种 类 型 流量 的 共存 ， 如 业务 流 IP、 块 存储 
FCoE、 网 络 电话 VoIP、 视 频 流 VoIP 等 。 


以 太 网 数据 链 
路 层 帧 





图 7-31 融合 增强 型 以 太 网 (CEE) 
增强 传输 选择 (Enhanced Transmission Selection，ETS) 通过 为 不 同 的 业务 流量 
设 定 优先 级 ， 从 而 保证 了 高 优先 级 业务 的 带宽 ， 也 允许 低 优先 级 流量 使 用 高 优先 级 队列 
的 闲置 带宽 ， 提 高 整个 网 络 的 效率 。 
拥塞 通告 是 一 种 在 二 层 网 络 对 持续 拥塞 流量 的 端 到 端 管理 方法 。 当 网 络 中 发 生 拥 塞 
时 ， 由 拥塞 点 向 数据 源 发 送 指示 来 限制 引起 拥塞 的 流量 ， 并 在 拥塞 消失 时 通知 其 取消 限制 。 


7.4.2 FCoE 协议 栈 


光纤 通道 和 以 太 网 都 是 使 用 数据 链 路 层 协议 在 网 络 节点 间 进 行 数据 帧 传输 的 ， 如 果 
要 实现 将 FC 帧 封装 在 以 太 网 帧 中 通过 成 熟 的 以 太 网 络 来 完成 终端 到 终端 的 数据 传输 , 必 
须要 有 相关 协议 的 支撑 ， 即 FCoE 协议 。 
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开放 系统 互 连 参考 模型 (0pen System Interconnect， 简 称 0SI) 把 网 络 通信 的 工 
作 分 为 7 层 ， 从 下 往 上 分 别 是 物理 层 、 数 据 链 路 层 、 网 络 层 、 传 输 层 、 会 话 层 、 表 示 层 
和 应 用 层 。 物 理 层 是 传输 网 络 信和 号 的 物理 媒介 ， 在 设备 之 间 传 输 比特 流 ， 规 定 了 电 平 、 
速度 和 电费 针脚 ， 数 据 链 路 层 是 帧 协议 层 ， 将 比特 组 合成 字 节 ， 再 将 字 节 组 合成 帧 ， 使 
用 链 路 层 地 址 《以太 网 使 用 MAC 地 址 ) 来 访问 介质 ， 并 进行 差错 检测 。 如 图 7-32 所 示 ， 
在 FCoE 协议 栈 中 ，FC-0 和 FC-1 被 映射 成 为 Ethernet 协议 的 数据 链 路 层 和 物理 层 ， 把 
FC-2 层 以 上 的 内 容 封 装 到 以 太 网 报 文中 进行 承载 , 并 添加 了 FCoE 映射 层 作 为 上 层 FC 协 
议 栈 与 底层 Ethernet 协议 栈 之 问 的 适 配 层 。 











FC-4 (高 层 协议 映射 ) | FC 协议 层 | Ec4 JU 表示 层 
(无 改变 ) 
sms | {| Bn 
eT 岂 = 人 
IEEE 802.3 
(Ethemed 物理 


图 7-32 FCoE 协议 栈 


FCoE 协议 实现 了 将 一 个 完整 的 FC 帧 封装 在 以 太 帧 中 的 功能 ， 其 报 文 封装 格式 如 
图 7-33 所 示 。 其 中 以 太 帧 头 中 指定 了 报 文 的 源 MAC 地 址 、 目 MAC 地 址 、 以 太 帧 类 型 和 
FCoE 的 VLAN，FCoE 帧 头 指 定 了 FCoE 帧 版 本 号 和 控制 信息 ，FC 帧 头 和 传统 FC 帧 头 相同 ， 
指定 了 FC 帧 的 源 地 址 、 目 的 地 址 等 信息 ，FC 帧 内 容 即 为 SCSI 的 指令 、 数 据 和 状态 信息 
单元 。 
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以 太 网 | FCoE | FC 
帧 头 | 帧 头 | 帧 关 光纤 通道 的 有 效 载荷 校 验 | 帧 结束 人 





图 7-33 ”FCoE 报 文 封装 格式 


通常 情况 下 , 一 个 以 太 网 的 帧 最 大 为 1500 字 节 ,而 一 个 典型 的 FC 帧 最 大 为 大 约 2112 
字 节 ,因此 在 以 太 网 上 打包 FC 帧 时 往往 需要 进行 分 段 发 送 ， 然 后 在 接收 方 进行 重组 。 这 
种 分 段 再 重组 的 传输 方式 会 产生 额外 的 处 理 开 销 , 影响 FCoE 端 到 端的 传输 效率 。 既然 以 
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太 网 和 光纤 通道 各 自 所 传输 的 帧 之 间 存 在 的 这 种 差异 ， 那 自然 需要 一 个 更 大 的 以 太 网 帧 
来 平衡 差异 , 于 是 便 出 现 了 FCoE 以 太 网 巨型 帧 , 尽管 这 种 巨型 帧 不 是 正式 的 IEEE 标准 ， 
但 它 允 许 以 太 网 帧 在 长 度 上 达到 9KB。 

如 图 7-34 所 示 ， 最 大 的 巨型 帧 (9KB) 可 以 实现 一 个 以 太 网 帧 封装 四 个 FC 帧 的 功 
能 ， 但 如 此 一 来 ， 相 应 的 帧 组 合 、 恢 复 和 流量 控制 过 程 自然 变 得 复杂 。 值 得 注意 的 是 ， 
在 使 用 FCoE 以 太 网 巨型 帧 时 ， 要 求 所 有 以 太 网 交换 机 和 终端 设备 支持 该 类 型 帧 的 格式 。 


.普通 以 太 网 由 
目的 MAC 源 MAC | 。 以 太 网 由 FCoE 有 效 | | 杖 
地 址 地 址 类 型 序列 
6 字 节 6 字 节 2 字 节 下 





小 于 1500 字 节 





帧 校 验 
序列 


*FCoE 以 太 网 巨型 帧 
目的 MAC 源 MAC 以 太 网 帧 
地 址 地 址 类 型 
2112 字 节 或 
大 于 2112 字 节 


图 7-34 普通 以 太 网 帧 与 FCoE 以 太 网 巨型 帧 





7.4.3 ”FCoE 应 用 场景 


存储 区 域 网 络 的 一 个 重要 应 用 场景 是 大 型 数据 中 心 。 在 传统 的 数据 中 心 组 网 中 ， 服 
务 器 与 服务 器 、 客 户 端 之 间 的 通信 基于 以 太 网 LAN， 服 务 器 与 存储 设备 之 间 的 通信 基于 
存储 区 域 网 络 SAN。 而 LAN 网 络 和 SAN 网 络 的 部 署 和 维护 都 是 相互 独立 ， 如 图 7-35 所 示 。 


FC-SAN 网 络 IP-SAN 网 络 





图 7-35 传统 数据 中 心 组 网 


一 174 一 


第 7 章 SAN 技术 介绍 


随 着 数据 中 心 的 迅 独 发展， 数据 量 和 服务 器 数量 日 益 剧 增 ，LAN 和 SAN 独立 部 署 方 
式 已 经 无 法 满足 企业 的 需求 ， 出 现 两 个 挑战 : (1) 设备 的 增加 使 网 络 越 来 越 复杂 ， 同 
时 ，LAN 和 SAN 网 络 的 独立 部 署 使 得 业务 部 署 的 灵活 性 差 ， 网 络 扩展 困难 ， 维 护 和 管理 
成 本 高 ; (2) 能 效 比 低 : 服务 器 上 需 配置 多 块 网 卡 ， 用 于 接 入 LAN 的 网 络 接口 卡 NIC 
和 SAN 的 主机 总 适配器 HBA, 配置 多 类 型 的 网 卡 增加 了 整个 数据 中 心 的 电力 消耗 和 冷却 
成 本 。 

如 果 大 型 数据 中 心 采用 以 太 网 光线 通道 FCoE 构建 网 络 ， 如 图 7-36 所 示 ，FCoE 组 网 
方式 既 文 持 LAN 网 络 的 数据 传输 ， 也 支持 FC 网 络 的 数据 传输 。 


IP-SAN 网 络 FC-SAN 网 络 






FCoE 交换 机 


图 7-36 ”FCoE 组 网 


采用 以 太 网 光线 通道 FCoE 构建 网 络 具 有 如 下 优势 : 

优势 一 :降低 总 体 拥有 成 本 TC0 

FCoE 技术 共享 网 络 资源 ， 整 合 LAN 和 SAN 网 络 ， 并 有 效 地 利用 资源 ， 减 少 对 于 SAN 
网 络 基础 设施 的 投资 ， 简 化 网 络 复杂 度 ， 降 低 网 络 的 管理 和 维护 成 本 ; 同时 ， 服 务 器 采 
用 融合 网 络 适配器 ( 即 ，CNA 卡 )， 无需 像 传统 网 络 去 配置 LAN 网 络 接口 卡 NIC 和 SAN 主 
机 总 适配器 HBA， 减 少数 据 中 心 的 电力 和 冷却 成 本 。 

优势 二 : 强大 的 投资 保护 

FCoE 可 以 和 数据 中 心 现 有 的 以 太 网 及 FC 基础 设施 实现 无 颖 互通 ， 同 时 保护 了 客户 
在 现 有 以 太 网 和 FC 网 络 上 的 投资 。 

优势 三 ， 增 强 的 业务 灵活 性 

FCoE 使 得 所 有 服务 器 共享 存储 资源 。 特 别 是 在 虚拟 机 迁移 的 应 用 场景 下 ， 可 为 虚拟 
机 提供 一 致 的 存储 连接 ， 提 高 了 系统 的 灵活 性 和 可 用 性 ， 增 强 的 业务 灵活 性 。 
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本 章 介 绍 了 SAN 存储 区 域 网 络 相关 技术 。 首 先 描述 SAN 网 络 的 概念 ， 并 介绍 SAN 网 
络 组 网 、 组 件 ， 并 对 比 了 DAS 和 SAN 两 种 存储 架构 ; 其 次 对 SAN 网 络 中 的 FC SAN 基本 概 
念 、 相 关 原 理 和 组 网 进行 阐述 , 并 介绍 了 FC 协议 、FC SAN 组 网 、FC 交换 机 端口 和 FC Zone 
等 内 容 ; 接着 对 SAN 网 络 中 的 IP SAN 基本 概念 、 相 关 原 理 和 组 网 进行 曾 述 ， 并 介绍 了 
iSCSI 协议 、IP SAN 组 网 和 IP SAN 应 用 等 内 容 ; 最 后 对 SAN 网 络 中 FCoE 协议 的 基本 概 
念 、 协 议 栈 和 应 用 场景 进行 阐述 。 


一 、 选 择 题 
1. 描述 1; IP SAN 为 了 元 余 使 用 了 两 个 交换 机 ， 并 创建 了 两 个 网 络 ;描述 2: 在 一 
个 FC 交换 机 中 ， 主 机 可 以 加 入 多 个 zone ， 这 两 个 描述 中 【 ) 
。 描述 1 对 ; 描述 2 对 
. 描述 1 对; 描述 2 错 
描述 1 错 ; 描述 2 对 
描述 1 错 ; 描述 2 错 
FC SAN 具有 如 下 哪些 特征 : 〈 
无 损 协议 B， 单 网 络 
IQN zoning D. 最 多 可 达 1. 677 亿 个 设备 
速率 可 达 10 Gb F. 设计 包含 单 点 故障 
. 在 IP SAN 组 网 中 ， 针 对 iSCSI 三 种 连接 方式 的 下 述 描述 正确 的 是 ? (  ) 
. 以太 网 卡 十 Initiator 软件 方式 , 需要 占用 主机 CPU 资源 ， 导 致 主机 系统 性 能 的 


下 降 

B. TOE 网 卡 十 Initiator 软件 方式 ，TCP 协议 处 理 则 交 由 TOE 网 卡 完 成 ， 减 轻 了 主 
机 端的 负担 

C. TOE 网 卡 十 Initiator 软件 方式 ，iSCSI 协议 处 理 则 交 由 TOE 网 卡 完成 ， 减 轻 了 
主机 端的 负担 

D. ISCSI HBA 卡 方式 ，iSCSI 协议 功能 及 TCP/IP 协议 栈 功能 均 由 iSCSI HBA 卡 完 
成 ， 对 主机 的 开销 占用 最 小 
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思考 题 


.SAN 有 哪 五 个 主要 特点 ? 


.划分 FC zone 的 方法 有 哪些 ? 


. IP SAN 和 FC SAN 有 什么 区 别 ? 


.IP SAN 的 连接 模块 有 哪些 ? 他 们 有 什么 特征 ? 


.iSCSI initiator and target 的 功能 是 什么 ? 


一 177 一 


Wau 


| 唤 Wo i 
| 由 证 


Ne 
‘a 加 “Nn 


sh 
| 而 a i'l 


wh 
WI 川 un 
a 全 





8.1 
8.2 
8.3 
8.4 
8.5 
8.6 
8.7 
8.8 





自动 精简 技术 
分 层 存储 技术 
Cache 技 术 
快照 技术 
克隆 技术 
远程 复制 技术 
LUN 拷 贝 技 术 
本 章 小 结 


练习 题 





随 着 信息 技术 的 发 展 ， 企 业 数 据 量 增多 ， 很 多 企业 考虑 购置 或 已 经 购置 满足 需求 的 
存储 产品 。 然 而 ， 在 存储 产品 使 用 过 程 中 常常 会 面临 存储 空间 浪费 、 存 储 性 能 低下 、 数 
据 丢 失 等 问题 。 本 章 讲 的 SAN 存储 优化 技术 涉及 提高 空间 利用 率 、 提 升 存储 性 能 、 增 强 
数据 可 用 性 等 方面 ， 掌 握 本 章 知识 有 助 于 系统 架构 师 在 前 期 规划 、 中 期 实施 、 后 期 优化 
中 最 大 化 利用 存储 资源 以 满足 用 户 需 求 。 


PT 


。 掌握 SAN 存储 优化 技术 的 原理 ; 
e 掌握 常用 SAN 存储 优化 技术 。 


六 耿 电 冰 


3 
下 e 了解 常用 SAN 存储 优化 技术 的 产生 背景 ; 
3 
2 


Ee 


本 章 按 存储 空间 利用 率 、 存 储 性 能 、 数 据 可 用 性 三 个 角度 来 介绍 SAN 存储 的 优化 技 
术 ， 分 别 从 技术 产生 背景 和 技术 原理 两 个 方面 介绍 自动 精简 技术 、 分 层 存 储 技术 、Cache 
技术 、 快 照 技 术 、 克 隆 技术 、 远 程 复制 技术 和 LUN 拷贝 技术 等 存储 优化 技术 。 其 中 ， 自 
动 精简 技术 用 于 提高 存储 空间 利用 率 ， 分 层 存 储 技术 和 Cache 技术 用 于 提升 存储 性 能 ， 
快照 技术 、 克 隆 技术 、 远 程 复制 技术 和 LUN 拷贝 技术 可 归 到 数据 备份 领域 中 ， 用 于 防范 
数据 丢失 ， 提 高 数据 可 用 性 。 
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8.1.1 自动 精简 技术 背景 


随 着 各 行业 数字 化 进程 的 推进 ， 一 方面 ， 数 据 逐 渐 成 为 企 事业 单位 的 核心 资源 ， 另 
一 方面 ， 数 据 量 呈现 爆炸 式 增长 。 存 储 系 统 作为 数据 的 载体 ， 也 面临 着 越 来 越 高 的 用 户 
要 求 。 传 统 的 存储 系统 部 署 方式 要 求 在 IT 系统 的 设计 规划 初期 ， 能 够 准确 预 估 其 生命 
周期 (3 到 5 年 ， 甚 至 更 长 时 间 》 内 业务 的 发 展 趋势 以 及 对 应 的 数据 增长 趋势 。 然 而 ， 
在 信息 技术 日 新 月 异 的 时 代 ， 要 做 到 精确 的 估计 对 系统 规划 者 来 说 是 一 项 近乎 不 可 完成 
的 任务 。 一 个 错误 的 规划 设计 往往 导致 存储 空间 利用 率 的 不 均衡 ， 一 些 系统 没有 多 余 的 
存储 空间 来 存储 增长 迅速 的 关键 业务 系统 数据 ， 而 另 一 些 系统 却 有 大 量 的 空余 存储 空间 
被 浪费 。 即 便 规划 设计 能 够 准确 预测 未 来 5 年 的 数据 增长 量 ， 但 在 系统 部 署 之 初 就 投入 
大 量 成 本 购买 未 来 5 年 所 需 的 存储 空间 ， 这 大 大 加 重 了 企业 的 运营 成 本 。 

按照 传统 的 存储 系统 部 署 方式 ， 为 某 项 应 用 程序 分 配 使 用 存储 空间 时 ， 通 常 预 先 从 
后 端 存储 系统 中 划分 足够 的 空间 给 该 项 应 用 程序 ， 即 使 所 划分 的 空间 远 远大 于 该 应 用 程 
序 所 需 的 存储 空间 ， 划 分 的 空间 也 会 被 提前 预 留 出 来 ， 其 他 应 用 程序 无 法 使 用 。 这 种 空 
间 分 配方 式 不 仅 会 造成 存储 空间 的 资源 浪费 ， 而 且 会 促使 用 户 购买 超过 实际 需求 的 存储 
容量 ， 加 大 了 企业 的 投资 成 本 。 

最 大 限度 地 保护 用 户 前 期 投资 ， 同 时 有 效 降低 后 期 运 维 、 升 级 等 成 本 已 成 为 数据 存 
储 系统 设计 和 管理 中 的 关键 技术 挑战 。 针 对 上 述 挑战 ， 研 究 人 员 提 出 了 一 种 称 为 自动 精 
简 配 置 (Thin-provisioning) 的 存储 资源 虚拟 化 技术 ”" 。 自 动 精简 配置 的 设计 理念 
是 通过 存储 资源 池 来 达到 物理 空间 的 整合 , 以 按 需 分 配 的 方式 来 提高 存储 空间 的 利用 率 。 
该 技术 不 仅 可 以 减少 用 户 的 前 期 投资 ， 而 且 推迟 了 系统 扩容 升级 的 时 间 ， 有 效 降 低 了 用 
户 整 体 运 维 成 本 。 


8.1.2 ”自动 精简 技术 原理 


自动 精简 配置 技术 最 初 由 3PAR 公司 开发 ， 目 的 是 提高 磁盘 空间 的 利用 率 ， 确 保 物 
理 磁盘 容量 只 有 在 用 户 需 要 的 时 候 才能 被 调 取 使 用 。 自 动 精简 技术 是 一 种 按 需 (容量) 
分 配 的 技术 ， 依 据 应 用 程序 实际 所 需要 的 存储 空间 从 后 端 存储 系统 分 配 容量 ， 不 会 一 次 
性 将 划分 的 空间 全 部 给 某 项 应 用 程序 使 用 ， 当 分 配 的 空间 无 法 满足 应 用 程序 使 用 时 ， 系 
统 会 再 次 从 后 端的 存储 系统 中 分 配 容 量 空间 。 除 了 有 助 于 提高 空间 的 利用 率 之 外 ， 自 动 
精简 技术 还 能 降低 用 户 整 体 运 维 成 本 ， 例 如 ， 前 期 规划 时 预 留 一 部 分 存储 卷 给 用 户 ， 用 
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户 在 后 期 使 用 过 程 中 ， 系 统 可 以 自动 扩展 已 经 分 配 好 的 存储 卷 ， 无 需 手动 扩展 。 

自动 精简 技术 作为 容量 分 配 的 技术 ， 它 的 核心 原理 是 按 需 解 发 容量 “欺骗 "， 欺 骗 
的 对 象 为 管理 容量 的 文件 系统 ， 让 文件 系统 认为 它 管理 的 存储 空间 中 很 充足 ， 而 实际 上 
文件 系统 管理 的 物理 存储 空间 则 按 需 分 配 的 。 例 如 ， 在 存储 设备 上 启用 自动 精简 配置 特 
性 后 , 文件 系统 可 能 显示 2TB 的 逻辑 空间 , 而 实际 上 只 有 5006B 的 物理 空间 是 被 利用 的 。 
尽管 只 有 500GB 的 空间 被 利用 ， 但 随 着 用 户 往 存 储 系统 写 入 越 来 越 多 的 数据 ， 实 际 物理 
存储 的 容量 会 达到 上 限 2TB， 其 空间 利用 率 也 会 越 来 越 高 。 


8.1.3 自动 精简 技术 应 用 


各 大 存储 厂商 对 自动 精简 技术 都 有 所 涉及 ， 为 便于 理解 该 技术 ， 下 文 对 华为 技术 有 
限 公司 提出 的 SmartThin 自动 精简 配置 技术 进行 解读 。 

SmartThin 自动 精简 配置 技术 具有 如 下 特点 。 

(1) 按 需 分 配 。SmartThin 技术 可 以 减少 前 期 的 投入 , 减少 总 拥有 成 本 (Total Cost 
of Ownership，TC0 从 产品 采购 到 后 期 使 用 、 维 护 的 总 成 本 )。 满 足 客户 对 存储 容量 不 断 
增长 的 需求 ， 增 强 存储 系统 的 利用 率 和 扩展 性 。 

(2) 支持 在 线 扩容 。Smart Thin 技术 可 用 于 在 线 扩容 。 一 方面 , 业务 系统 正常 运行 ， 
无 需 中 断 ;， 另 一 方面 ，Smart Thin 技术 在 进行 存储 扩容 时 ， 不 必 对 原 有 数据 进行 迁移 或 
者 备份 ， 有 效 避 免 了 数据 迁移 带 来 的 风险 ， 降 低 了 数据 备份 成 本 。 

(3) 自动 化 容量 管理 。 用 户 不 必 费 心 为 不 同 的 业务 配置 不 同 的 容量 ， 通 过 竞争 机 制 
分 配 各 种 业务 所 需 容量 ， 最 终 达 到 存储 容量 的 最 优化 配置 。 

SmartThin 技术 以 一 种 按 需 分 配 的 方式 来 管理 存储 设备 ， 基 于 RAID2. 0+ 存 储 虚 拟 资 
源 池 创 建 Thin LUN， 以 Grain 为 单位 (请 参看 第 5 章 RAID 2. 0+ 技 术 ， 内 有 Grain 技术 
详解 )。Thin LUN 是 一 种 LUN 类 型 ， 支 持 虚拟 资源 分 配 ， 能 够 以 较 简便 的 方式 进行 创建 、 
扩容 和 压缩 操作 ， 因 此 SmartThin 自动 精简 配置 技术 也 称 为 Thin LUN 技术 。Thin LUN 
在 创建 的 时 候 ， 可 以 设置 一 个 初始 分 配 容量 。Thin LUN 创建 完成 后 ， 存 储 池 只 会 分 配 初 
始 容量 大 小 的 空间 ， 剩 余 的 空间 还 放 在 存储 池 中 。 当 Thin LUN 已 分 配 的 存储 空间 的 使 用 
率 达到 阀 值 的 时 候 ， 存 储 系统 会 从 存储 池 中 划分 一 定 的 配额 给 Thin LUN。 如 此 反复 直到 
达到 Thin LUN 最 初 设置 的 全 部 容量 。 如 果 最 初 设置 的 容量 大 于 物理 存储 空间 ， 那 么 可 通 
过 扩充 后 端 存储 资源 池 的 方式 来 进行 系统 扩容 ， 整 个 扩容 过 程 无 需 业 务 系统 停机 ， 对 用 
户 完全 透明 。 

在 图 8-1 中 ， 假 设 后 端 存储 总 共有 5006B 的 存储 空间 ， 考 虑 到 客户 暂时 不 需要 使 用 
如 此 大 的 存储 空间 ， 按 照 SmartThin 自动 精简 配置 策略 ， 将 后 端 2006GB 物理 存储 空间 做 
RAID 5 后 映射 给 客户 机 使 用 ， 其 余 3006B 作为 预 留 空间 给 客户 备用 ， 并 设置 了 当 用 户 的 
使 用 空间 达到 180GB 时 ， 自 动 为 用 户 扩 容 。 客 户 机 在 挂 载 使 用 后 ， 看 到 的 空间 为 500GB 
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的 存储 空间 ， 但 其 真实 使 用 的 空间 为 原先 管理 员 设 置 的 2006B 空间 ， 用 户 往 主机 里 面 存 
储 的 数据 存储 在 200GB 的 空间 内 。 当 存储 的 空间 达到 管理 员 设 置 的 180GB 时 ， 存 储 系统 
会 自动 将 原先 设置 的 300GB 空间 在 用 户 无 感知 的 情况 下 自动 分 配给 用 户 使 用 。 


Thin LUN 存储 实际 数据 物理 存储 空间 (存储 池 ) 


RAIDS 


se EE 
分 配 


上 用 时 再 分 本 








图 8-1 SmartThin 空间 容量 分 布 


8.2 ”分 层 存 储 技术 


8.2.1 分 层 存储 技术 背景 


随 着 科学 技术 的 发 展 ，ICT 领域 也 在 不 断 发 生变 化 。 在 当今 IT 领域 中 ， 企 业 与 管理 
部 门 通常 会 遇 到 数据 存储 的 容量 、 性 能 与 价格 等 方面 的 挑战 。 一 方面 企业 面临 原先 购买 
的 存储 设备 不 能 满足 现 如 今 发 展 而 带 来 的 存储 空间 不 足 的 问题 ; 另 一 方面 ， 随 着 企业 
的 不 断 发 展 ， 需 要 收集 保存 的 数据 也 会 越 来 越 多 ， 这 会 在 一 定 程度 上 影响 IT 存储 系统 
的 性 能 。 

对 于 企业 在 日 常 工作 中 的 业务 应 用 来 说 ， 并 不 是 所 有 的 数据 都 具有 非常 高 的 使 用 价 
值 。 随 着 时 间 的 推移 ， 有 些 数据 在 一 定 的 时 间 范 围 内 被 频繁 的 访问 ， 这 些 数据 通常 称 为 
热 数据 ， 而 有 些 数 据 则 很 少 或 者 没有 被 用 户 读 取 访 问 ， 这 些 数 据 通常 称 为 冷 数据 。 

经 过 科学 的 统计 和 分 析 ， 数 据 信息 的 调 取 和 使 用 在 生命 周期 过 程 中 是 有 规律 的 ， 换 
人 句 话说 ， 信 息 生 命 周 期 是 有 迹 可 循 的 。 在 通常 情况 下 ， 新 生成 的 数据 信息 会 经 常 被 用 户 
读 取 与 访问 ， 其 有 较 高 的 使 用 价值 ， 随 着 时 间 的 推移， 这 些 新 生成 的 数据 信息 使 用 频率 
呈现 下 降 的 趋势 ， 直 至 在 很 长 的 一 段 时 间 内 不 被 用 户 访问 ， 其 使 用 价值 在 逐年 降低 。 存 
储 系统 容量 和 资源 会 被 这 些 大 量 的 低 使 用 价值 的 数据 信息 占据 ， 影 响 其 性 能 。 然 而 ， 这 
些 低 使 用 价值 数据 由 于 受 数 据 仓库 建设 、 政 策 法 规 限 制 等 原因 不 能 删除 ， 如 何 解决 这 些 
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不 常用 数据 的 保存 问题 ， 是 目前 企业 面临 的 数据 管理 难题 之 一 。 企 业 通 常 使 用 备份 或 
者 归档 方式 将 长 期 不 访问 的 数据 从 高 成 本 的 存储 阵列 上 迁移 至 低 成 本 的 归档 设备 中 ， 
但 面 对 数据 爆炸 式 增长 带 来 的 大 量 低 访问 周期 数据 ， 如 何 解决 存储 问题 依然 面临 诸多 
的 问题 。 

数据 生命 周期 灵活 有 效 管理 问题 。 庞 大 的 数据 量 会 使 数据 的 管理 难度 加 大 ， 难 以 依 
靠 人 力 将 数据 及 时 合理 分 配 到 存储 空间 。 

数据 空间 占用 高 性 能 存储 问题 。 大 量 使 用 价值 不 高 的 数据 占用 的 存储 介质 空间 过 
多 ， 会 导致 资源 浪费 的 问题 ， 为 了 保证 新 数据 的 访问 性 能 ， 需 要 不 断 购买 新 的 高 性 能 的 
存储 设备 来 实现 扩容 问题 。 

如 何 解决 上 述 问 题 ， 是 企业 在 发 展 过 程 中 必须 要 思考 的 问题 ， 尤 其 是 在 IT 系统 初 
期 搭建 过 程 中 , 要 考虑 数据 生命 周期 管理 的 问题 。 因此 研究 者 提出 了 自动 分 层 存 储 技术 。 
分 层 存 储 也 称 层级 存储 管理 (Hierarchical Storage Management，HSM) ""。 自 动 分 层 
存储 技术 首先 将 不 同 的 存储 设备 进行 分 级 管理 ， 形 成 多 个 存储 级 别 ; 然后 通过 预先 定义 
的 数据 生命 周期 或 者 迁移 策略 将 数据 自动 迁移 到 相应 级 别 的 存储 中 ， 将 访问 频率 高 的 热 
数据 迁移 到 高 性 能 的 存储 层级 ,将 访问 频率 低 的 冷 数据 迁移 到 低 性 能 大 容量 的 存储 层级 。 
以 下 列 出 自动 分 级 存储 的 两 个 设计 目标 。 

1) 降低 成 本 

通过 预先 定义 的 数据 生命 周期 或 者 迁移 策略 ， 将 访问 频率 较 低 的 数据 ( 即 冷 数据 ) 
迁移 到 低 性 能 、 大 容量 的 存储 层级 ， 将 访问 频率 高 的 数据 《〈 即 热 数据 ) 迁移 到 高 性 能 的 
存储 层级 。 按 80/20 定律 ，20% 数 据 是 热 数据 ，80% 数 据 是 冷 数据 ， 热 数据 的 比例 较 小 ， 
采用 上 述 迁 移 策略 有 助 于 节约 高 速 存储 介质 ， 从 而 降低 存储 设备 的 总 成 本 。 

2) 简化 存储 管理 ， 提 高 存储 系统 性 能 

通过 对 企业 业务 的 分 析 管 理 ， 设 置 合适 的 企业 数据 迁移 策略 ， 将 极 少 使 用 的 大 部 分 
数据 迁移 到 低 性 能 、 大 容量 的 存储 层级 ， 减 少 冷 数据 对 系统 资源 的 占用 ， 可 以 提高 存储 
系统 的 总 体 性 能 。 

从 广义 的 角度 讲 ， 分 层 存储 系统 一 般 分 为 在 线 《0n-line) 存储 、 近 线 (Near-line) 
存储 和 离线 (0ff-line) 存储 三 种 存储 方式 ， 有 具体 区 别 详 见 表 8-1。 

表 8-1 三 种 存储 方式 综合 比较 
mm 
| 在 线 存 储 | 即时 服务 | 小 ”| 高 | 快 | 高 | 
人 

在 线 存储 将 数据 存放 在 SAS 磁盘 阵列 、 固 态 内 存 磁盘 、 光 纤 通 道 磁盘 这 类 高 速 的 存 
储 介质 上 。 此 类 存储 介质 适合 那些 访问 频率 高 、 存 储 重要 的 程序 和 文件 ， 其 优点 是 数据 
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读 写 速度 快 、 性 能 好 ， 缺 点 是 存储 价格 相对 昂贵。 在 线 存 储 属 于 工作 级 的 存储 ， 其 最 大 
的 特征 为 : 存储 设备 和 所 存储 的 数据 一 直 保 持 “ 在 线 ” 状 态 ， 数 据 可 以 随时 读 取 与 修改 ， 
满足 高 效 访问 的 数据 访问 需求 。 

近 线 存储 是 指 将 数据 存放 在 SATA 磁盘 阵列 、DVD-RAM 光盘 塔 和 光盘 库 等 这 类 低速 的 
存储 介质 上 ， 对 这 类 存储 介质 或 存储 设备 要 求 寻 址 速度 快 ， 传 输 速率 高 。 近 线 存 储 对 性 
能 要 求 并 不 高 ， 但 要 求 有 较 好 的 访问 吞吐 率 和 较 大 的 容量 空间 ， 其 主要 定位 是 介 于 在 线 
存储 与 离线 存储 之 间 的 应 用 , 例如 保存 一 些 不 重要 或 访问 频 度 较 低 的 需 长 期 保存 的 数据 。 
从 性 能 和 价格 的 角度 ， 近 线 存 储 是 在 线 存 储 与 离线 存储 之 间 的 一 种 折 中 方案 ， 其 存 取 性 
能 和 价格 介 于 高 速 磁盘 与 磁带 之 间 / 

离线 存储 也 称 为 备份 级 存储 ， 通 常 将 数据 备份 到 磁带 或 者 磁带 库 等 存储 介质 上 ， 
此 类 存储 介质 访问 速度 低 ， 价 格 便宜 ， 大 多 数 情况 下 用 于 在 线 存储 或 近 线 存 储 的 数 
据 进 行 备份 ， 防 范 数 据 的 竺 失 ， 适 用 于 存储 无 价值 但 需 长 期 保留 的 历史 数据 、 备 份 
数据 等 。 


8.2.2 ”分 层 存 储 技术 分 析 


在 分 层 存 储 系统 中 ， 根 据 数据 生命 周期 管理 策略 或 数据 访问 频 度 ， 需 要 在 不 同 存储 
等 级 的 设备 之 间 进 行 数据 迁移 ， 此 时 ， 需 要 关注 如 下 几 个 方面 。 

1， 数 据 一 致 性 

分 层 存储 系统 中 数据 迁移 可 分 为 降级 迁移 和 提升 迁移 。 冷 数据 需要 降级 迁移 ， 热 数 
据 则 需要 进行 提升 迁移 ， 这 两 种 数据 迁移 的 目的 、 特 征 是 不 相同 的 。 降 级 迁移 是 将 数据 
迁移 到 低速 存储 设备 上 ， 对 于 降级 迁移 来 说 ， 因 为 是 迁移 冷 数据 ， 在 迁移 过 程 中 很 可 能 
不 会 出 现 前 端 用 户 I/0 请 求 。 升 级 迁移 则 将 数据 迁移 到 高 性 能 存储 设备 上 ， 对 升级 迁移 
来 说 ， 迁 移 主 要 发 生 在 I/0 最 密集 的 时 间 段 ， 通 常会 有 前 端 用 户 1/0 请 求 发 生 ， 如 果 是 
写 请 求 ， 那 么 迁移 数据 和 用 户 请 求 数据 就 存在 数据 不 一 致 问题 。 针 对 数据 不 一 致 问题 ， 
通常 的 应 对 措施 是 采用 读 写 锁 ， 以 数据 块 为 调度 粒度 来 减 小 前 端 I/0 性 能 的 影响 。 迁 移 
过 程 中 ， 迁 移 进 程 为 当前 数据 块 申请 读 写 锁 ， 保 证 数据 在 迁移 操作 与 写 操作 之 间 的 数据 
一 致 性 。 

2. 增 量 扫 描 

在 一 个 文件 数 为 10 亿 级 的 大 规模 文件 系统 中 ， 选 择 分 级 存储 管理 操作 的 候选 对 象 
是 一 个 耗 时 操作 , 一 般 须 扫描 整个 文件 系统 的 名 字 空 间 。 假设 , 每 秒 能 扫描 5000 个 文件 ， 
扫描 10 亿 个 文件 大 约 需 要 27 小 时 。 为 了 提高 扫描 性 能 ,一 种 应 对 方案 是 增 量 扫描 技术 ， 
其 技术 要 点 有 二 条 : 1) 扫描 系统 元 数据 ， 而 非 扫描 整个 文件 系统 ; 2) 扫描 近期 某 一 时 
间 段 内 所 有 被 访问 文件 的 次 数 和 大 小 、 总 访问 热度 等 信息 ， 因 为 近期 被 访问 文件 占 整 体 
文件 系统 的 比例 很 低 。 
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采用 增 量 扫描 技术 ， 一 方面 按照 文件 访问 情况 进行 针对 性 扫描 ， 能 够 大 幅度 减少 文 
件 扫描 规模 。 例 如 ， 一 个 拥有 20 万 个 文件 的 文件 系统 ， 每 天 只 有 不 到 1% 的 文件 被 访问 
( 随 着 文件 系统 规模 增加 ， 访 问 百 分 比 还 会 下 降 )， 男 一 方面 ， 通 过 元 数据 服务 器 定期 获 
取 近 期 访问 过 的 文件 信息 ， 可 以 大 大 减少 文件 扫描 任务 量 ， 从 而 减少 维护 文件 访问 信息 
的 开销 。 

3. 数据 自动 迁移 存储 

在 实际 应 用 中 ， 当 数据 信息 达到 迁移 触发 条 件 时 ， 系 统 会 自动 启动 数据 迁移 进程 ， 
从 而 实现 冷 数据 的 降级 存储 和 热 数据 的 升级 存储 。 分 级 存储 中 数据 需要 在 线 迁 移 ， 这 就 
需要 考虑 数据 移动 对 前 端 1/0 负载 的 性 能 影响 。 数 据 自 动迁 移 技 术 要 求 最 大 限度 地 降低 
数据 迁移 动作 本 身 对 前 端 用 户 1/0 性 能 的 影响 ， 并 且 迁 移 过 程 对 前 端 应 用 是 透明 的 ， 它 
根据 前 端 1/0 负载 的 变化 来 调整 数据 迁移 速率 ， 即 迁移 进程 要 完成 负载 感知 的 数据 迁移 
调度 和 迁移 速率 控制 ， 使 得 数据 迁移 动作 本 身 对 存储 系统 的 QoS 的 影响 非常 小 ， 同 时 使 
得 数据 迁移 任务 能 够 尽快 完成 。 

4. 数据 的 迁移 策略 设计 

数据 信息 分 级 策略 是 依据 信息 数据 的 重要 程度 、 访 问 频率 、 生 命 周 期 等 多 种 指标 对 
数据 进行 价值 分 级 。 数 据 分 级 后 在 合适 的 时 间 迁 移 到 不 同 级 别 的 存储 设备 中 ， 以 达到 最 
佳 的 存储 状态 。 因 此 科学 的 数据 分 级 显得 非常 重要 ， 要 充分 挖 扬 数 据 的 静态 特征 和 动态 
特征 ， 以 获得 更 好 的 分 级 存储 效果 。 以 文件 系统 为 例 ， 进 行文 件 分 级 时 需要 注意 以 下 三 
点 : 1) 文件 系统 的 静态 特征 需 关 注 大 小 文件 的 分 布 ，2) 文件 系统 的 宏观 访问 规律 需 关 
注 大 小 文件 的 访问 次 数 ; 3) 文件 之 间 的 访问 关联 特征 需 关 注 文件 在 被 访问 的 同时 另外 
一 个 文件 在 什么 时 间 段 被 访问 。 依 据 这 些 特征 和 存储 设备 的 分 级 情况 ， 确 定 文件 分 级 
标准 和 文件 分 级 变化 的 触发 条 件 ， 从 而 在 合适 的 时 间 将 数据 迁移 到 不 同 级 别 的 存储 设 
备 中 。 

数据 迁移 最 佳 策略 是 各 类 最 优 策 略 的 组 合 ， 也 就 是 因 需 制 宜 地 选择 合适 的 迁移 算法 
或 迁移 方法 。 例 如 ， 根 据 数据 年 龄 〈 即 创建 之 后 的 存在 时 间 ) 进行 迁移 的 策略 可 以 用 在 
归档 及 备份 系统 中 ， 根 据 访 问 频 度 进行 迁移 的 策略 可 以 用 于 虚拟 化 存储 系统 中 。 


8.2.3 分 层 存储 技术 应 用 


分 层 存 储 技术 有 两 个 重要 标准 :“ 精 细 度 ”与 “运算 周期 ”。 

“精细 度 ” 是 指 系统 执行 存 取 行 为 、 收 集 分 析 与 数据 迁移 操作 的 单位 ， 它 决定 了 执 
行 数据 迁移 时 操作 单元 的 大 小 。“ 精 细 度 ”并 不 是 越 小 越 好 。“ 精 细 度 ” 越 小 ， 虽然 能 提 
高 空间 利用 率 , 但 会 加 大 迁移 开销 ， 影 响 存储 设备 的 性 能 ， 因 此 ,“ 精 细 度 ” 需 合理 规划 
配置 。 假 设 需 要 在 一 个 50GB 的 LUN 上 进行 数据 迁移 ， 若 采用 的 精细 度 为 16B， 则 系统 只 
需 追 踪 50 个 数据 分 块 ， 若 采用 更 小 的 精细 度 ， 如 10MB， 则 系统 就 需要 追踪 5 万 个 数据 
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分 抉 ,操作 量 高 出 100 倍 。 

“运算 周期 ”是 指 系统 执行 存 取 行 为 、 统 计 分 析 与 数据 迁移 操作 的 周期 ， 它 反映 磁 
盘存 取 行 为 的 时 间 变 化 。 运 算 周期 越 短 、 存 取 操 作 越 密集 ， 系 统 将 能 更 快 地 依照 最 新 的 
磁盘 存 取 特性 ， 重 新 配置 数据 在 不 同 磁盘 层 集中 的 分 布 。 运 算 周 期 太 长 ， 统 计 分 析 与 数 
据 迁 移 操作 会 占用 过 多 I/0 资源 。 

以 华为 技术 有 限 公 司 的 数据 迁移 技术 SmartTier 为 例 ，SmartTier 的 精细 度 为 
512KB 一 64MB， 默 认 是 4MB， 最 小 运算 周期 为 1 小 时 。 

目前 主要 存在 基于 块 、 基 于 文件 和 基于 对 象 的 三 类 自动 分 层 存 储 技 术 。SmartTier 
是 基于 块 的 自动 分 层 存储 技术 , 它 将 存储 分 成 三 个 层级 : 高 性 能 层 (由 SSD 组 成 )、 性 能 
层 (SAS 组 成 )、 容 量 层 (NL-SAS)， 各 存储 层级 划分 详 见 表 8-2。 


高 性 能 层 
适合 热 数据 : 存储 至 或 迁移 至 性 和 
[1 > 二 人 3 号 1 攻 
性 能 层 | SAS 硬盘 层 硬盘 的 较 活跃 数据 
低 IOPS; 任务 响应 时 间 | 适合 存储 请 求 | 淮 数 据 ， 存 依 ， 或 汪 移 到 省 最 
容量 层 “|NL-SAS 硬盘 | 长 ; 每 单位 存储 请 求 处 | 密度 低 的 业务 | 层 je 
据 迁 移 后 , 其 现 有 性 能 不 会 受 
理 成 本 很 高 负载 Ce 


高 性 能 层 通常 采用 高 性 能 的 SSD 硬盘 ， 支 持 高 IOPS， 低 响应 时 间 ， 适 用 于 存放 业务 
系统 中 最 活跃 数据 。 当 然 ， 高 性 能 层 存储 成 本 也 是 最 高 的 。 性 能 层 一 般 采 用 SAS 硬盘 ， 
用 于 支持 具有 高 带宽 、 响 应 时 间 适 中 要 求 的 业务 负载 ， 即 较为 活跃 的 热 数 据 。 容 量 层 一 
般 采 用 NL-SAS 硬盘 , NL-SAS 硬盘 是 SATA 的 盘 体 与 SAS 连接 器 的 组 合体 (NL-SAS 硬盘 的 
转速 只 有 7200rpm， 性 能 比 10000RPM 的 SAS 硬盘 差 。 由 于 使 用 了 SAS 接口 ， 在 寻 址 与 速 
度 上 比 SATA 硬盘 有 了 提升 )， 其 适用 于 低 IOPS、 响 应 时 间 长 的 业务 负载 ， 即 访问 频 度 较 
低 的 冷 数据 。 

如 果 存 储 系统 想 开启 SmartTier 功能 ， 必 须 配 备 有 两 种 或 者 两 种 以 上 不 同性 能 的 磁 
盘 。 具 体 流程 如 图 8-2 所 示 ， 首 先 ， 根 据 设 定 的 时 间 监 控 I0 的 活跃 度 ， 其 次 ， 对 数据 进 
行 活跃 度 的 分 析 ， 并 排序 最后， 根据 数据 活跃 度 和 数据 迁移 策略 进行 数据 迁移 操作 。 
具体 地 操作 是 将 活跃 度 低 的 数据 迁移 到 速度 较 慢 但 是 空间 较 大 的 容量 层 ， 将 活跃 度 一 般 
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的 数据 迁移 到 速度 较 高 的 性 能 层 ， 将 活跃 度 最 高 的 一 部 分 数据 迁移 到 速度 更 快 的 高 性 能 
层 ， 从 而 为 活跃 度 比较 高 的 数据 提供 更 快 的 响应 速度 。 迁 移 粒度 是 RAID2. 0+ 技 术 中 的 
Extent 的 大 小 〈512KB 一 64MB)， 默 认为 4MB。 


统计 每 个 数据 块 的 活跃 计数 


数据 排 布置 分 析 对 每 个 数据 的 活跃 计数 进行 排序 





根据 排名 结果 和 数据 迁移 策略 实施 数据 迁移 


图 8-2 存储 实现 SmartTier 实现 阶段 


阶段 一 :1/0 监控 

1/0 监控 阶段 由 存储 系统 的 I/0 监控 模块 完成 。 存 储 系统 根据 两 个 数据 块 的 活跃 度 
来 判断 一 个 数据 块 比 另 一 个 更 热 或 更 冷 。 每 个 数据 块 的 活跃 度 通过 统计 数据 块 的 读 写 访 
问 频率 和 I/0 比例 得 出 。 通 常 ， 系 统 提供 的 是 数据 块 活跃 度 的 加 权 累 计 值 。 作 为 实时 监 
控 任 务 ， 所 有 数据 块 都 会 被 持续 统计 。 

阶段 二 : 数据 排 布 分 析 

数据 排 布 分 析 阶 段 由 存储 系统 的 数据 排 布 分 析 模 块 完成 。 首 先 ， 以 1/0 监控 模块 生 
成 的 每 个 数据 块 的 统计 信息 作为 输入 ， 根 据 存 储 池 中 各 个 存储 层 的 容量 ， 系 统 按 照 数据 
块 的 热度 确定 出 每 个 存储 层 放 置 数 据 块 的 1/0 计数 阔 值 (确定 阔 值 时 ， 按 照 热 度 最 高 的 
数据 块 放 在 最 高 性 能 层级 的 原则 进行 )。 数 据 排 布 分 析 模 块 对 大 于 阅 值 的 数据 块 进行 排 
序 ， 选 出 最 热 数据 块 优先 进行 迁移 。 数 据 排 布 分 析 模 块 会 对 存储 池 中 的 每 个 数据 块 进行 
排名 ， 排 名 由 高 至 低 ， 从 同一 个 存储 池 中 的 最 热 数据 块 开始 ， 直 到 最 冷 数据 块 ， 需 要 注 
意 ， 排 名 操作 仅 限于 在 同一 个 存储 池 中 进行 。 

阶段 三 : 数据 迁移 

数据 迁移 阶段 由 存储 系统 的 数据 迁移 模块 完成 。SmartTier 根据 数据 排 布 分 析 阶 段 
对 数据 块 的 排名 结果 和 数据 迁移 策略 实施 数据 迁移 ，SmartTier 所 采用 的 排名 结果 是 数 
据 迁 移 前 数据 排 布 分 析 模块 得 出 的 最 近 一 次 分 析 结 果 。 通 常 ， 迁 移 模 块 将 排名 高 的 数据 
块 迁移 至 较 高 存储 层 (通常 是 高 性 能 层 或 性 能 层 ), 将 排名 低 的 数据 块 迁移 至 较 低 存储 层 
(通常 是 性 能 层 或 容量 层 )。 
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8.3 Cache 技术 


8.3.1 Cache 技术 背景 


在 动态 的 业务 环境 中 提高 应 用 程序 的 响应 速度 ， 是 一 项 成 本 高 昂 且 复杂 耗 时 的 任 
务 。 应 用 程序 的 响应 延迟 过 大 会 影响 业务 的 效率 ， 进 而 降低 企业 的 生产 效率 和 客户 服务 
的 水 平 。 随 着 服务 器 处 理 能 力 不 断 的 增长 ， 存 储 系统 的 性 能 成 为 制约 应 用 程序 响应 速度 
的 一 个 重要 因素 。 虽 然 存储 系统 通过 增加 普通 缓存 资源 (如 RAM Cache)， 能 够 提升 存储 
设备 的 访问 速度 ， 但 普通 缓存 具有 价格 昂贵 、 容 量 较 小 、 数 据 掉 电 丢失 等 缺点 ， 存 储 厂 
商 将 目光 转 到 固态 硬盘 SSD 上 。 

SSD 具有 响应 时 间 短 、 容 量 远 大 于 普通 缓存 资源 的 优点 ， 与 传统 的 机 械 人 硬盘 相 比 ， 
SSD 能 大 幅 提 升 响应 速度 ， 实 现 了 最 高 的 10 性价比 。 利 用 SSD 这 一 特性 ， 将 SSD 盘 作 为 
读 缓存 资源 ， 可 以 减少 存储 系统 的 读 响 应 时 间 ， 有 效 提 高 热点 数据 的 访问 效率 ” 。 


8.3.2 ”Cache 技术 原理 


各 厂家 对 智能 闪存 Cache 技术 有 不 同 的 定义 ,但 基本 原理 及 最 终 实现 效果 基本 相同 。 
如 EMC 厂家 将 Cache 技术 称 为 FAST Cache 技术 ， 而 华为 技术 有 限 公 司 称 为 SmartCache 
技术 。 不 管 是 EMC 的 FAST Cache 技术 还 是 华为 的 SmartCache 技术 ， 都 具有 提高 效率 、 
提升 性 能 的 作用 。 下 文 以 华为 技术 有 限 公司 开发 的 SmartCache 技术 为 例 曾 述 Cache 技术 
原理 。 

SmartCache 又 叫 智能 数据 缓存 。 利 用 SSD 盘 对 随机 小 I/0 读 取 速度 快 的 特点 ， 通 过 
SSD 盘 组 成 智能 缓存 池 ， 将 访问 频率 高 的 随机 小 1/0 热点 读数 据 从 传统 的 机 械 硬 盘 复 制 
到 由 SSD 盘 组 成 的 高 速 智能 缓存 池 中 。 由 于 SSD 盘 的 数据 读 取 速度 远 远 高 于 机 械 硬 盘 ， 


更 进一步 讲 ，SmartCache 将 智能 缓存 池 划 分 成 多 个 分 区 ， 为 业务 提供 细 粒 度 的 SSD 
缓存 资源 。 不 同 的 业务 可 以 共享 同一 个 分 区 ， 也 可 以 分 别 使 用 不 同 的 分 区 ， 各 个 分 区 之 
间 互 不 影响 ， 从 而 可 以 向 关键 应 用 提供 更 多 的 缓存 资源 ， 保 障 关键 应 用 的 性 能 。 此 外 ， 
采用 SmartCache 不 会 中 断 现 有 业务 ， 也 不 会 影响 数据 的 可 靠 性 , 因为 SSD 属于 非 易 失 性 
存储 。 

利用 SSD 盘 较 短 的 响应 时 间 和 较 高 的 IOPS (Input/0utput 0perations Per Second) 
特性 , SmartCache 特性 可 以 提高 业务 的 读 性 能 .SmartCache 适用 于 存在 热点 数据 的 场景 ， 
且 读 操作 多 于 写 操作 的 随机 小 I/0 业务 场景 , 包括 在 线 事务 处 理 0LTP 应 用 、 数 据 库 、Web 
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服务 、 文 件 服务 应 用 等 。 
8.4 快照 技术 


8.4.1 快照 技术 背景 


随 着 信息 技术 的 发 展 ， 数 据 备份 的 重要 性 也 逐渐 凸显 。 最 初 的 数据 备份 方式 中 ， 恢 
复 时 间 目 标 (Recovery Time 0bjective, RT0) 和 恢复 点 目标 (Recovery Point Objective， 
RP0) 无 法 满足 业务 的 需求 ， 而 且 数 据 备份 过 程 会 影响 业务 性 能 ， 甚 至 中 断 业 务 。 当 企业 
数据 量 逐 渐 增 加 且 数 据 增长 速度 不 断 加 快 时 ， 如 何 缩短 备份 窗口 成 为 一 个 重要 问题 。 因 
此 ， 各 种 数据 备份 、 数 据 保护 技术 不 断 被 提出 。 

恢复 时 间 目 标 RTO 是 容 灾 切换 时 间 最 短 的 策略 。 以 恢复 时 间 点 为 目标 ， 确 保 容 灾 机 
能 够 快速 接管 业务 。 后 续 第 11 章 将 有 详细 介绍 。 

恢复 点 目标 RP0 是 数据 丢失 最 少 的 容 灾 切换 策略 。 以 数据 恢复 点 为 目标 ， 确 保 容 灾 
切换 所 使 用 的 数据 为 最 新 的 备份 数据 。 后 续 第 11 章 将 有 详细 介绍 。 

备份 窗口 指 在 用 户 正常 使 用 的 业务 系统 不 受 影响 的 情况 下 ， 能 够 对 业务 系统 中 的 业 
务 数 据 进行 数据 备份 的 时 间 间 隔 ， 或 者 说 是 用 于 备份 的 时 间 段 。 

快照 技术 是 众多 数据 备份 技术 中 的 一 种 ， 其 原理 与 日 常生 活 中 的 拍照 类 似 ， 通 过 拍照 
可 以 快速 记录 下 拍照 时 间 点 拍照 对 象 的 状态 。 由 于 可 以 瞬间 生成 快照 ， 通 过 快照 技术 ， 能 够 
实现 零 备 份 窗口 的 数据 备份 , 从 而 满足 企业 对 业务 连续 性 和 数据 可 靠 性 的 要 求 。 实现 快照 技 
术 的 方式 有 很 多 ， 本 节 主 要 介绍 写 时 复制 (COW) 和 重 定向 写 (ROW) 两 种 快照 技术 。 


8.4.2 快照 技术 原理 


存储 网 络 工业 协会 (SNIA) 对 快照 (Snapshot ) 的 定义 是 “A point in time copy 
of a defined collection of data”, 指 指定 数据 集合 在 某 个 时 间 点 的 一 个 完整 可 用 副 
本 。 根据 不 同 的 应 用 需求 ， 可 以 对 文件 、LUN、 文 件 系 统 等 不 同 的 对 象 创建 快照 。 快 照 生 
成 后 可 以 被 主机 读 取 ， 也 可 以 作为 某 个 时 间 点 的 数据 备份 。 

从 具体 的 技术 细节 来 讲 ， 快 照 是 指向 保存 在 存储 设备 中 的 数据 的 引用 标记 或 指针 ， 
即 快照 可 以 被 看 作 详 细 的 目录 表 ， 但 它 被 计算 机 作为 完整 的 数据 备份 来 对 待 。 

快照 有 三 种 基本 形式 ; 基于 文件 系统 式 的 、 基 于 子 系 统 式 的 和 基于 卷 管 理 器 /虚拟 
化 式 的 ， 而 且 这 三 种 形式 差别 很 大 。 市 场 上 已 经 出 现 了 能 够 自动 生成 这 些 快 照 的 实用 工 
其， 比如 ，NetApp 存储 设备 使 用 的 操作 系统 ， 实 现 文件 系统 式 快照 ，HP 的 EVA、HDS 通 
用 存储 平台 以 及 EMC 的 高 端 阵列 则 实现 了 子 系统 式 快 照 ; 而 Veritas 则 通过 卷 管理 器 实 
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现 快照 。 

常见 快照 技术 有 两 种 ， 分 别 是 写 时 复制 (Copy On Write，COW) 快照 技术 中 和 重 定 
向 写 (Redirect 0n Write，ROW) 快照 技术 ”。 下 文 以 写 时 复制 快照 技术 COW 为 例 描述 
其 原理 及 使 用 场景 。 

写 时 复制 快照 技术 在 数据 第 一 次 写 入 到 某 个 存储 位 置 时 ， 首 先 会 将 原 有 的 内 容 读 取 
出 来 ， 写 到 另 一 个 位 置 〈 此 位 置 是 专门 为 快照 保留 的 存储 空间 ， 简 称快 照 空间 )， 然 后 再 
将 新 写 入 的 数据 写 入 到 存储 设备 中 。 当 有 数据 再 次 写 入 时 ， 不 再 执行 复制 操作 ， 此 快照 
形式 只 复制 首次 写 入 空间 前 的 数据 。 

写 时 复制 快照 技术 使 用 原先 预 分 配 的 空间 来 创建 快照 ， 快 照 创建 激活 以 后 ， 倘 若 物 
理 数据 没有 发 生 复 制 变 动 时 ， 只 需要 复制 原始 数据 物理 位 置 的 元 数据 ， 快 照 创建 瞬间 完 
成 。 如 果 应 用 服务 器 对 源 LUN 有 写 数 据 请 求 ， 存 储 系 统 首先 将 被 写 入 位 置 的 原 数 据 ( 写 
前 拷贝 数据 ) 拷贝 到 快照 数据 空间 中 ， 然 后 修改 写 前 拷贝 数据 的 映射 关系 ， 记 录 写 前 拷 
贝 数 据 在 快照 数据 空间 中 的 新 位 置 ， 最 后 再 将 新 数据 写 入 到 源 LUN 中 ， 其 操作 示意 如 图 
8-3 所 示 。 


拷贝 (复制 ) 原 数 据 
新 数据 首次 写 入 


变化 数据 


源 卷 快照 卷 
图 8-3 COW 数据 写 入 


COW 技术 中 ， 源 卷 在 创建 快照 时 才 建 立 快照 卷 ， 快 照 卷 只 占用 很 小 的 一 部 分 存储 空 
间 ， 这 部 分 空间 用 来 保存 快照 时 间 点 之 后 元 数据 发 生 首次 更 新 的 数据 ， 在 快照 时 间 点 之 
前 是 不 会 占用 存储 资源 的 ， 不 会 影响 系统 性 能 ， 使 用 方式 也 非常 灵活 ， 可 以 在 任意 时 间 
点 为 任意 数据 建立 快照。 

从 COW 的 数据 写 入 过 程 可 以 看 出 ， 如 果 对 源 卷 做 了 快照 ， 在 数据 初次 写 入 源 卷 时 ， 
需要 完成 一 个 读 操作 《〈 读 取 源 卷 数据 的 内 容 )， 两 个 写 操作 〈 源 卷 以 前 数据 写 入 到 快照 空 
间 ， 新 数据 写 入 源 卷 空间 )， 读 取 数 据 内 容 时 ， 则 直接 从 源 卷 读 取 数 据 ， 不 会 对 读 操作 有 
影响 。 如 果 是 频繁 写 入 数据 的 场景 ， 采 用 了 COW 快照 技术 会 消耗 I/0 时 间 。 由 此 可 知 ， 
COW 快照 技术 对 写 操作 有 影响 ,对 读 操作 没有 影响 ， 从 而 ，COW 快照 技术 适合 于 读 多 写 少 
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的 业务 场景 。 
8.4.3 快照 技术 特点 及 应 用 


快照 技术 具有 如 下 两 方面 优点 。 

(1) 快照 生成 时 间 短 : 存储 系统 可 以 在 几 秒 内 生成 一 个 快照 ， 获 取 源 数据 的 一 致 性 
副本 。 

(2) 占用 存储 空间 少 : 生成 的 快照 数据 并 非 完 整 的 物理 数据 拷贝 ， 不 会 占用 大 量 存 
储 空间 ， 即 使 源 数据 量 很 大 ， 也 上 只 会 占用 很 少 的 存储 空间 。 

快照 技术 可 应 用 于 以 下 两 个 方面 。 

(1) 保证 业务 数据 安全 性 : 当 存 储 设备 发 生 应 用 故障 或 者 文件 损坏 时 可 以 进行 及 时 
数据 恢复 ， 将 数据 恢复 成 快照 产生 时 间 点 的 状态 ， 另 外 ， 快 照 灵活 的 时 间 策 略 ， 可 以 为 
其 设置 多 个 激活 时 间 点 ， 为 源 LUN 保存 多 个 恢复 时 间 点 ， 实 现 对 业务 数据 的 持续 保护 。 

(2) 重新 定义 数据 用 途 : 快照 生成 的 多 份 快照 副本 相互 独立 且 可 供 其 他 应 用 系统 直 
接 读 取 使 用 。 例 如 ， 应 用 于 数据 测试 、 归 档 和 数据 分 析 等 多 种 业务 。 这 样 既 保护 了 源 数 
据 ， 又 赋予 了 备份 数据 新 的 用 途 ， 满 足 企业 对 业务 数据 的 多 方面 需求 。 
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8.5.1 克隆 技术 背景 


随 着 信息 技术 的 发 展 ， 数 据 的 安全 性 和 可 用 性 越 来 越 成 为 企业 关注 的 焦点 。20 世纪 
90 年 代 ， 数 据 备份 需求 大 量 涌现 。 在 一 些 实际 应 用 中 ,用 户 需 要 从 生产 数据 中 复制 出 一 
份 副本 用 于 独立 的 测试 、 分 析 , 这 种 用 途 催生 了 能 适 配 该 需求 的 数据 保护 技术 一 一 克隆 。 
经 过 不 断 地 发 展 ， 如 今 殉 隆 已 经 成 为 存储 系统 中 不 可 或 缺 的 一 种 数据 保护 特性 。 

克隆 技术 可 以 实现 用 户 的 如 下 需求 。 

(1) 完整 的 数据 备份 。 实 现 了 数据 的 完整 备份 ， 数 据 恢复 不 依赖 源 数 据 ， 提 供 可 靠 
的 数据 保护 。 

(2) 持续 的 数据 保护 。 源 数据 和 副本 可 实时 同步 ,提供 持续 保护 ， 实 现 零 数据 丢失 。 

(3) 可 靠 的 业务 连续 性 。 备 份 和 恢复 的 过 程 都 可 在 线 进行 ， 不 中 断 业 务 ， 实 现 零 备 
份 窗口 。 

(4) 有 效 的 性 能 保障 。 可 将 一 份 源 数据 产生 多 个 副本 ， 将 副本 单独 用 于 应 用 测试 和 
数据 分 析 ， 主 、 从 LUN 性 能 互 不 影响 。 在 多 业务 并 行 条 件 下 有 效 保障 各 业务 性 能 。 

(5) 稳定 的 数据 一 致 性 。 支 持 同时 生成 多 份 源 数据 在 同一 时 间 点 的 副本 ， 保 证 了 备 
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份 时 间 点 的 一 致 性 ， 从 而 保护 数据 库 等 应 用 中 不 同 源 数据 所 生成 的 副本 之 间 的 相关 性 。 
8.5.2 ”克隆 技术 原理 


克隆 是 一 种 快照 技术 ， 是 源 数 据 在 某 个 时 间 点 的 完整 副本 ， 是 一 种 可 增 量 同步 的 备 
份 方 式 。 其 中 ,“ 完 整 ” 指 对 源 数 据 进 行 完全 复制 生成 数据 副本 ;“ 增 量 同步 ”指数 据 副 
本 可 动态 同步 源 数 据 的 变更 部 分 。 克 隆 技术 中 ， 保 存 源 数据 的 LUN 称 为 主 LUN， 保 存 数 
据 副本 的 LUN 称 为 从 LUN。 

各 厂家 对 克隆 技术 都 有 所 涉及 ， 下 文 以 华为 技术 有 限 公司 开发 的 克隆 HyperClone 
技术 为 例 介绍 克隆 具体 实现 过 程 。 要 注意 的 一 点 是 华为 技术 有 限 公司 开发 的 数据 克隆 技 
术 克 隆 一 定 是 在 同一 台 设 备 上 的 备份 ， 这 是 与 远程 复制 等 比较 大 的 区 别 。 克 隆 的 主要 用 
途 是 备份 主 LUN 数据 以 供 日 后 还 原 ， 或 者 保存 一 份 主 LUN 在 某 一 时 间 点 的 副本 ， 用 于 单 
独 读 写 。 从 这 两 种 用 途 出 发 ， 克 隆 的 实现 过 程 分 为 三 个 实现 阶段 ， 同步、 分裂 和 反 疝 同 
步 ， 如 图 8-4 所 示 。 









当 需 要 创建 
可 用 副本 时 


反 向 同步 后 
自动 分 列 






了 
‘ 
7 \ 


/ 当 需 要 更 当 需 要 恢 、\ 
新 副本 时 复 主 LUN 


图 8-4 克隆 实现 阶段 










阶段 一 : 同步 

存储 系统 将 数据 从 主 LUN 拷贝 至 从 LUN， 然 后 同时 写 主 、 从 LUN。 在 同步 过 程 中 ， 
主机 仍然 可 以 对 主 LUN 进行 读 写 ， 从 而 保证 业务 的 连续 性 。 

阶段 二 : 分 裂 

同步 完成 后 ， 用 户 可 以 在 某 一 时 刻 分 裂 Pair (在 克隆 中 ， 主 LUN 和 每 个 从 LUN 构成 
一 个 Pair。Pair 用 于 表示 主 LUN 和 从 LUN 之 间 的 镜像 关系 ; 一 个 克隆 中 只 能 有 一 个 主 
LUN， 但 可 以 添加 多 个 从 LUN。 每 添加 一 个 从 LUN， 就 和 主 LUN 构成 一 个 新 的 Pair)， 此 
时 ， 从 LUN 便 成 为 主 LUN 的 可 用 副本 ， 该 副本 封存 了 分 裂 时 刻 主 LUN 的 所 有 数据 。 

分 裂 后 ， 从 LUN 可 以 提供 给 主机 读 写 ， 使 主机 既 可 以 读 写 分 裂 时 主 LUN 的 数据 ， 又 
不 会 影响 主 LUN 性 能 。 分 裂 后 ， 可 将 从 LUN 和 主 LUN 再 次 同步 或 者 反 向 同步 。 

阶段 三 ， 反 向 同步 

当 需 要 恢复 主 LUN 数据 时 ， 可 将 从 LUN 数据 反 向 同步 到 主 LUN 上 。 反 向 同步 后 Pair 
会 自动 分 裂 。 与 同步 相似 ， 在 反 向 同步 过 程 中 ， 主 机 仍然 可 以 对 主 LUN 进行 读 写 ， 从 而 
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保证 业务 的 连续 性 。 





8.6.1 远程 复制 技术 背景 


随 着 各 行 各 业 数 字 化 进程 的 推进 ， 数 据 逐 渐 成 为 企业 的 运营 核心 ， 用 户 对 承载 数据 
的 存储 系统 的 稳定 性 要 求 也 越 来 越 高 。 虽 然 企业 拥有 稳定 性 极 高 的 存储 设备 ， 但 还 是 无 
法 防止 各 种 自然 灾害 对 生产 系统 造成 不 可 恢复 的 毁坏 。 为 了 保证 数据 存 取 的 持续 性 、 可 
恢复 性 和 高 可 用 性 ， 企 业 需 要 考虑 远程 容 灾 解 决 方案 ， 而 远程 复制 技术 则 是 远程 容 灾 解 
决 方案 的 一 个 关键 技术 。 


8.6.2 ”远程 复制 技术 原理 


远程 复制 技术 (Remote Replication) 是 一 种 数据 保护 技术 ， 指 通过 建立 远程 容 灾 
中 心 ， 将 生产 中 心 的 数据 实时 或 者 周期 性 地 复制 到 灾 备 中 心 ”。 正 常情 况 下 ， 生 产 中 心 
提供 给 客户 端 存储 空间 供 其 使 用 ， 生 产 中 心 存储 的 数据 会 按照 用 户 设 定 的 策略 备份 到 容 
灾 中 心 ， 当 生产 中 心 由 于 断 电 、 火 灾 、 地 震 等 因素 无 法 工作 时 ， 生 产 中 心 将 网 络 切换 到 
容 灾 中 心 ， 容 灾 中 心 提供 数据 给 生产 中 心 使 用 。 

远程 复制 可 分 为 同步 远程 复制 和 异步 远程 复制 两 类 : 同步 远程 复制 会 实时 同步 数 
据 ， 最 大 限度 地 保证 数据 的 一 臻 性， 以 减少 灾难 发 生 时 的 数据 丢失 量 ; 异步 远程 复制 会 
周期 性 地 同步 数据 ， 最 大 限度 地 减少 数据 远程 传输 的 时 延 而 造成 的 业务 性 能 下 降 。 

各 大 厂商 对 远程 复制 技术 都 有 所 涉及 ， 下 文 以 华为 技术 有 限 公 司 的 Hyper 
Replication 为 例 来 解读 远程 复制 技术 。HyperReplication 是 容 灾 备 份 的 核心 技术 之 一 ， 
可 以 实现 远程 数据 同步 和 灾难 恢复 。 在 物理 位 置 上 分 离 的 存储 系统 ， 通 过 远程 数据 连接 
功能 ， 远 程 可 以 维护 一 套 或 多 套数 据 副 本 。 一 旦 灾难 发 生 ， 分 布 在 异地 灾 备 中 心 的 备份 
数据 并 不 会 受到 波及 ， 从 而 实现 灾 备 功能 。 

HyperReplication 同步 模式 将 主 存储 系统 中 的 数据 实时 复制 到 从 存储 系统 中 , 具体 
流程 参看 图 8-5。 
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A 站 点 B 站 点 





@ 主 机 I/0 存储 到 A 站 点 “” 回 数据 通过 内 部 链 路 传输 到 B 站 点 ”图 数 据 存储 到 B 站 点 
鸭 通 过 链 路 确认 ” 回 主 机 收 到 消息 ，I/0 完成 
图 8-5 远程 复制 同步 模式 

同步 远程 复制 的 流程 如 下 。 

(1) 从 主机 端 接收 1/0 请 求 后 ， 主 存储 系统 发 送 I/0 请 求 到 主 LUN 和 从 LUN。 

(2) 当 数 据 成 功 写 入 到 主 LUN 和 从 LUN 之 后 , 主 存储 将 数据 写 入 的 结果 返回 给 主机 。 
如 果 数 据 写 入 从 LUN 失败 ， 从 LUN 将 返回 一 个 消息 ， 说 明 数据 写 入 从 LUN 失败 。 此 时 ， 
远程 复制 将 双 写 模式 改 为 单 写 模式 ， 远 程 复制 任务 进入 异常 状态 。 

(3) 在 主 LUN 和 从 LUN 之 间 建 立 同步 远程 复制 关系 后 ， 需 要 手动 触发 数据 同步 ， 从 
而 使 主 LUN 和 从 LUN 的 数据 保持 一 致 。 当 数据 同步 完成 后 ， 每 次 主机 写 入 数据 到 存储 系 
统 ， 数 据 都 将 实时 地 从 主 LUN 复制 到 从 LUN。 

HyperReplication 异步 模式 将 主 存储 系统 中 的 数据 周期 性 复制 到 从 存储 系统 中 , 具 
体 流 程 如 图 8-6 所 示 。 


A 站 点 B 站 点 





@ 主 机 1/0 存储 到 A 站 点 ” 回 主 机 收 到 消息 : I/0 完成 ” 回 数 据 通过 链 路 传输 到 B 站 点 
团 数 据 存储 到 远 端 站 点 “” 回 通过 链 路 确认 
图 8-6 远程 复制 异步 模式 

异步 远程 复制 依赖 于 快照 技术 ， 快 照 是 源 数据 基于 时 间 点 的 拷贝 。 异 步 远 程 复制 的 
流程 如 下 。 

(1) 从 主机 端 接收 I/0 请 求 后 ， 主 存储 系统 发 送 1/0 请 求 到 主 LUN; 

(2) 当主 机 写 入 数据 到 主 LUIN， 只 要 主 LUN 返回 一 个 数据 写 入 成 功 的 消息 ， 主 存储 
系统 就 给 主机 返回 一 个 数据 写 入 成 功 的 消息 ; 
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(3) 当主 LUN 和 从 LUN 建立 异步 远程 复制 关系 之 后 , 将 触发 数据 初始 同步 , 把 主 LUN 
上 的 数据 全 部 复制 到 从 LUN， 从 而 使 主 LUN 和 从 LUN 数据 一 致 。 当 初始 同步 完成 后 ， 存 
储 系统 按 如 下 方式 处 理 主机 写 : 当 接 收 到 一 个 主机 写 ， 主 存储 系统 将 数据 发 送 到 主 LUN， 
只 要 主 LUN 返回 一 个 数据 写 入 成 功 的 消息 ， 主 存储 系统 就 返回 数据 写 入 成 功 的 消息 给 主 
机 ， 当 同步 操作 被 系统 定期 触发 时 ， 主 LUN 上 的 新 数据 被 复制 到 从 LUN; 

主 站 点 和 远程 站 点 之 间 不 管 是 采用 同步 远程 复制 技术 ， 还 是 异步 远程 复制 技术 ， 在 
主 站 点 被 破坏 的 情况 下 ， 故 障 切换 操作 都 可 以 被 启动 ， 即 在 远程 站 点 上 的 从 LUN 将 被 激 
活 。 在 远程 站 点 上 的 主机 将 再 次 与 数据 联系 起 来 ， 以 保持 业务 的 连续 性 。 当 然 ， 在 远程 
站 点 上 的 主机 ， 必 须 与 本 地 主机 运行 相同 的 业务 程序 。 


8.7 LUN 拷贝 技术 


8.7.1 LUN 拷贝 技术 背景 


随 着 各 行 各 业 数字 化 的 推进 ， 企 业 产生 了 因 设 备 升级 或 数据 备份 而 进行 数据 迁移 的 
需求 。 传 统 的 数据 迁移 过 程 是 存储 系统 一 应 用 服务 器 一 存储 系统 。 这 种 迁移 过 程 具有 
数据 迁移 速度 慢 的 缺点 ， 且 数据 在 迁移 过 程 中 还 会 占用 应 用 服务 器 的 网 络 资源 和 系统 
资源 。 为 了 提升 数据 迁移 速度 ， 人 们 提出 了 LUN 拷贝 技术 ， 待 迁移 数据 直接 在 存储 系 
统 之 间或 存储 系统 内 部 传输 ， 并 可 同时 在 多 个 存储 系统 间 迁 移 多 份 数据 ， 满 足 了 用 户 
快速 进行 数据 迁移 、 数 据 分 发 及 数据 集中 备份 的 需求 。 相 比 于 远程 复制 只 能 在 同类 型 
存储 系统 之 间 运 行 的 缺点 , LUN 拷贝 不 仅 支 持 同 类 型 存储 , 而 且 支 持 经 过 认证 的 第 三 方 
存储 系统 。 


8.7.2 LUN 拷贝 技术 原理 


LUN 拷贝 是 一 种 基于 块 的 将 源 LUN 复制 到 目标 LUN 的 技术 ， 可 以 同时 在 设备 内 或 设 
备 间 快速 地 进行 数据 的 传输 。 如 果 LUN 拷贝 需要 完整 地 复制 某 LUN 上 所 有 数据 ， 此 时 ， 
需要 和 暂停 该 LUN 的 业务 。LUN 拷贝 分 为 全 量 LUN 拷贝 与 增 量 LUN 拷贝 两 种 模式 。 

全 量 LUN 拷贝 : 将 所 有 数据 进行 完整 地 复制 ， 需 要 暂停 业务 ， 该 拷贝 模式 适用 于 数 
据 迁 移 业 务 。 

增 量 LUN 拷贝: 创建 增 量 LUN 拷贝 后 会 对 数据 进行 完整 复制 ,以 后 每 次 拷贝 都 只 
复制 上 次 拷贝 后 更 新 的 数据 。 这 种 LUN 拷贝 方式 对 主机 影响 较 小 ， 从 而 能 够 实现 数 
据 的 在 线 迁 移 和 备份 ， 无 需 暂 停业 务 。 该 拷贝 模式 适用 于 数据 分 发 、 数 据 集中 等 备 
份 业务 。 
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本 章 介 绍 了 SAN 存储 系统 的 多 项 优化 技术 ,包括 自动 精简 技术 、 分 层 存 储 技术 、Cache 
技术 、 快 照 技术 、 克 隆 技术 、 远 程 复制 技术 和 LUN 拷贝 技术 ， 这 些 技术 主要 用 于 优化 存 
储 空间 利用 率 、 存 储 性 能 和 数据 可 用 性 。 每 一 种 优化 技术 分 别 从 技术 产生 背景 、 技 术 原 
理 和 技术 应 用 场景 三 个 方面 进行 阐述 。 本 章 需 要 掌握 的 知识 点 包括 ; 自动 精简 技术 的 原 
理 、 分 层 存 储 技术 的 原理 、 快 照 技 术 的 性 能 指标 及 原理 、 远 程 复制 技术 的 分 类 、LUN 拷 
贝 技 术 的 分 类 等 。 


简 管 题 
1， 描述 自动 精简 技术 原理 。 


2. 全 量 LUN 拷贝 与 增 量 LUN 拷贝 有 什么 区 别 ? 


3. 同步 远程 复制 与 异步 远程 复制 有 什么 区 别 ? 
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NAS 产 生 与 发 展 
NAS 组 成 与 部 件 
NAS 文 件 共 享 协议 
NAS IO 访问 路 径 
NAS 和 SAN 的 比较 
NAS 产 品 介 绍 

本 章 小 结 


练习 题 





网 络 附加 存储 (Network Attached Storage，NAS) 是 基于 IP 网 络 、 通 过 文件 级 的 
数据 访问 和 共享 提供 存储 资源 的 网 络 存储 架构 。 本 章 主 要 介绍 NAS 产生 与 发 展 的 背景 ， 
以 及 NAS 的 组 成 与 部 件 ， 重 点 介绍 NAS 文件 共享 协议 CIFS 和 NFS， 并 概括 NAS 与 SAN 二 
者 区 别 。 
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[， 人 下 

人 内包 oo。 掌握 NAS 的 5 和 移 同 六 民 

e 了 解 NAS 与 SAN 的 区 别 ; 

。 学 习 NAS 产品 的 实现 以 及 应 用 。 





9.1.1 NAS 产生 背景 


随 着 网 络 技术 的 飞速 发 展 ， 企 业 在 网 络 中 共享 资料 、 共 享 数据 的 需求 越 来 越 大 。 跨 
平台 的 、 安 全 的 、 高 效 的 文件 共享 是 网 络 附加 存储 (Network Attached Storage,， NAS) 
产生 的 内 在 驱动 力 。IT 工程 师 为 了 实现 文件 网 络 共享 ， 将 大 量 的 文件 存储 在 一 人 台 专 用 的 
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文件 服务 器 上 ， 其 他 用 户 可 以 通过 网 络 对 这 些 文 件 进行 存 取 。 随 着 企业 的 发 展 和 数据 的 
海量 产生 ， 网 络 中 不 同 主机 间 的 数据 共享 需求 越 来 越 大 ， 而 NAS 设备 能 够 提供 大 量 存储 
空间 ， 并 支持 高 效 文件 共享 功能 ， 恰 好 满足 企业 的 存储 需要 。 

在 过 去 ，KB 级 别 的 文件 共享 使 软盘 变 得 普及 。 而 随 着 企业 的 不 断 发 展 ， 大 容量 数据 
的 跨 平台 共享 需求 也 在 不 断 上 升 ， 此 时 出 现 了 可 移动 存储 介质 ， 比 如 闪存 ， 它 提供 GB 量 
级 的 存储 空间 ， 并 取代 了 软盘 的 位 置 。 然 而 ， 企 业 不 仅仅 需要 大 量 存储 空间 ， 还 需要 通过 
网 络 便利 地 共享 和 使 用 数据 ， 因 此 具备 存储 和 网 络 双重 特性 的 NAS 是 一 个 不 错 的 选择 。 对 
于 服务 器 /主机 而 言 ，NAS 是 一 个 外 部 设备 ， 可 灵活 部 署 在 网 络 中 ， 同 时 ，NAS 提供 文件 级 
共享 ， 通 过 其 客户 端 可 以 直接 访问 到 所 需 文件 。 图 9-1 所 示 为 文件 共享 技术 的 演变 过 程 。 





单机 PC 光盘 文件 共享 


he 


文件 服务 器 共享 





图 9-1 文件 共享 技术 演变 过 程 


9.1.2 NAS 概念 


NAS 也 称 为 网 络 附加 存储 ， 是 一 种 将 分 布 的 、 独 立 的 数据 进行 整合 ， 集 中 管理 数据 
的 存储 技术 , 为 不 同 主机 和 应 用 服务 器 提供 文件 级 存储 空间 ,其 逻辑 架构 如 图 9-2 所 示 。 
网 络 附加 存储 


以 太 网 接口 以 太 网 接口 


文件 系统 
卷 管理 模块 ty 
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i 
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图 9-2 NAS 架构 
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从 使 用 者 的 角度 ，NAS 是 连接 到 一 个 局 域 网 的 基于 IP 的 文件 共享 设备 ”。NAS 通过 
文件 级 的 数据 访问 和 共享 提供 存储 资源 ， 使 客户 能 够 以 最 小 的 存储 管理 开销 快速 地 共享 
文件 ， 这 一 特征 使 得 NAS 成 为 主流 的 文件 共享 存储 解决 方案 。 另 外 ，NAS 有 助 于 消除 用 
户 访问 通用 服务 器 时 的 性 能 瓶颈 ，NAS 通常 采用 TCPVIP 数据 传输 协议 和 CIFS/NFS 远程 
文件 服务 协议 来 完成 数据 归档 和 存储 。 

随 着 网 络 技术 的 快速 发 展 ， 支 持 高 速 传输 和 高 性 能 访问 的 专用 NAS 存储 设备 可 以 满 
足 当 下 企业 对 高 性 能 文件 服务 和 高 可 靠 数据 保护 的 应 用 需求 。 图 9-3 给 出 一 种 NAS 设备 
的 部 署 情况 ， 通 过 IP 网 络 ， 各 种 平台 的 客户 端 都 可 以 访问 NAS 设备 。 


客 
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OS=Windows OS=Linux OS=MAC OS 


eB 让 eb 
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NAS 设备 






图 9-3 NAS 设备 的 网 络 部 署 


NAS 客户 端 和 NAS 存储 设备 之 间 通 过 IP 网 络 通讯 ，NAS 设备 使 用 自己 的 操作 系统 和 
集成 的 硬 / 软 件 组 件 ， 满 足 特 定 的 文件 服务 需求 ，NAS 客户 端 可 以 是 跨 平台 的 ， 可 为 
Windows、Linux 和 Mac 系统。 与 传统 文件 服务 器 相 比 ，NAS 设备 支持 接 入 更 多 的 客户 机 ， 
支持 更 高 效 的 文件 数据 共享 。 


9.1.3 NAS 网 络 拓扑 


1. NAS 网 络 拓扑 

NAS 可 作为 网 络 节点 ， 直 接 接 入 网 络 中 ， 理 论 上 ,NAS 可 支持 各 种 网 络 技术 ， 支 持 多 
种 网 络 拓扑 ， 但 是 以 太 网 是 目前 最 普遍 的 一 种 网 络 连接 方式 ， 所 以 本 书 主要 讨论 的 是 基 
于 以 太 网 互 连 的 网 络 环境 。NAS 能 够 支持 多 种 协议 (如 NFS、CIFS、FTP、HTTP 等 ) 以 及 
支持 多 种 操作 系统 。 通过 任何 一 台 工 作 站 , 采用 IE 浏览 器 就 可 以 对 NAS 设备 进行 直观 方 
便 的 管理 ， 如 图 9-4 所 示 。 

2，NAS 的 实现 方式 

NAS 的 实现 方式 有 两 种 : 统一 型 NAS 和 网 关 型 NAS。 统 一 型 NAS 是 指 一 个 NAS 设备 
包含 所 有 NAS 组 件 ; 而 网 关 型 NAS 中 NAS 引擎 和 存储 设备 是 独立 存在 的 ， 使 用 时 二 者 通 
过 网 络 互 连 ， 存 储 设备 在 被 共享 访问 时 采用 块 级 1/0。 
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Windows 客户 端 UNIX 客户 端 
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Windows 服务 器 UNIX 服务 器 
图 9-4 NAS 网 络 拓扑 


图 9-5 所 示 为 统一 型 NAS 的 部 署 示意 ， 统 一 型 NAS 将 NAS 引擎 和 存储 设备 放 在 一 个 
机 框 中 ， 使 NAS 系统 具有 一 个 独立 的 环境 。NAS 引擎 通过 IP 网 络 对 外 提供 连接 ， 响 应 客 
户 端 的 文件 1/0 请 求 。 存 储 设备 由 多 个 硬盘 构成 , 硬盘 既 可 以 是 低 成 本 的 ATA 接口 硬盘 ， 
也 是 高 吞吐 量 的 FC 接口 硬盘 。NAS 管理 软件 同时 对 NAS 引擎 和 存储 设备 进行 管理 。 
客户 端 





应 用 服务 器 
9-5 统一 型 NAS 的 部 署 

在 网 关 型 NAS 的 解决 方案 中 ， 管 理 功能 更 加 细 分 化 ， 即 对 NAS 引擎 和 存储 设备 单独 
进行 管理 。 如 图 9-6 所 示 ，NAS 引擎 和 后 端 存储 设备 (如 存储 阵列 ) 通常 采用 FC 网 络 进 
行 连接 ， 与 统一 型 NAS 相 比 ， 网 关 型 NAS 存储 更 加 容易 扩展 ， 因 为 NAS 引擎 和 存储 设备 
都 可 以 独立 地 进行 扩展 。 

3. NAS 的 管理 环境 

在 统一 型 NAS 系统 的 管理 中 , 由 于 存储 设备 专用 于 NAS 存储 服务 , 属于 独占 式 存 储 ， 
所 以 NAS 管理 软件 可 以 对 NAS 部 件 和 后 端 存储 设备 同时 进行 管理 。 

在 网 关 型 NAS 系统 的 管理 中 , 网 关 型 NAS 系统 采用 共享 式 存储 , 这 意味 着 传统 的 SAN 
主机 也 可 以 使 用 后 端 存储 设备 (如 存储 阵列 )。NAS 引擎 和 存储 阵列 都 通过 自己 的 专门 管 
理 软 件 进行 配置 和 管理 。 
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应 用 服务 器 





存储 阵列 





图 9-6 网 关 型 NAS 的 部 署 


4， NAS 与 文件 服务 器 对 比 

如 图 9-7 所 示 ， 文 件 服务 器 的 主要 功能 是 为 网 络 上 的 主机 提供 多 种 服务 ， 如 文件 共 
享 及 处 理 、 网 页 发 布 、FTP、 电 子 邮 件 服务 等 。 但 是 文件 服务 器 在 数据 备份 、 数 据 安全 等 
方面 并 不 占据 优势 。 而 NAS 本 质 上 是 存储 设备 而 不 是 服务 器 ， 它 专用 于 文件 数据 存储 ， 
将 存储 设备 与 服务 器 分 离 ， 提 供 文件 集中 存储 与 管理 的 功能 。NAS 可 以 看 作 是 优化 的 文 
件 服务 器 ， 其 对 文件 服务 、 存 储 、 检 索 、 访 问 等 功能 进行 了 优化 。 
















(Windows 或 者 是 UNIX) 
图 9-7 NAS 与 传统 文件 服务 器 的 对 比 


文件 服务 器 可 以 用 来 承载 任何 应 用 程序 ， 支 持 打 印 、 文 件 下 载 等 功能 ， 而 NAS 专用 
于 文件 服务 ， 通 过 使 用 开放 标准 协议 为 其 他 操作 系统 提供 文件 共享 服务 。 另 外 ， 为 了 提 
升 NAS 设备 的 高 可 用 性 和 高 可 扩展 性 ，NAS 还 支持 集群 功能 。 
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Re 9.2 NAS 组 成 与 部 件 
如 图 9-8 所 示 ，NAS 的 硬件 组 成 包括 : 1) NAS 引擎 (CPU 和 内 存 等 ); 2) 网 络 接口 


卡 〈《NIC)， 如 千 兆 以 太 网 卡 、 万 兆 以 太 网 卡 ; 3) 采用 工业 标准 存储 协议 (如 ATA、SCST、 
FC 等 ) 的 磁盘 资源 。 


存储 接口 





Windows 


存储 阵列 


图 9-8 NAS 的 组 成 


NAS 的 软件 组 成 包括 : 1) NAS 内 髓 操作 系统 ， 通 常 是 精简 版 的 Linux 系统 ， 对 NAS 
进行 管理 ，2) 文件 共享 协议 ， 如 NFS 和 CIFS; 3) 网 络 互 连 协议 ， 如 通过 使 用 IP 协议 


支持 NAS 和 客户 端 之 间 互 连 。 





大 多 数 NAS 设备 文 持 多 种 文件 共享 协议 以 处 理 远程 文件 系统 的 I/0 请 求 。 上 述 内 容 
提 到 ，NFS 和 CIFS 是 两 种 典型 文件 共享 协议 ””"”， 其 中 ，NFS 主要 用 于 UNIX 的 操作 
环境 ; CIFS 用 于 Windows 操作 环境 。 用 户 使 用 文件 共享 协议 可 以 跨越 不 同 操作 环境 进行 
文件 数据 共享 ， 文 件 共享 协议 支持 不 同 操作 系统 间 文 件 的 透明 迁移 。 


9.3.1 CIFS 协议 


通用 网 络 文件 系统 (Common Internet File System，CIFS) 是 一 个 网 络 文件 共享 
协议 ， 人 允许 Internet 和 Intranet 中 的 Windows 主机 访问 网 络 中 的 文件 或 其 他 资源 ， 达 
到 文件 共享 的 目的 , 其 示意 如 图 9-9 所 示 。CIFS 是 服务 器 消息 块 (Server Message Block， 
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SMB) 协议 的 一 个 公共 版 本 ，SMB 协议 让 本 机 程序 可 以 访问 局 域 网 内 其 他 机 器 上 的 文件 。 


CIFS 客户 CIFS 服务 器 
加 












图 9-9 CIFS 协议 应 用 


1. CIFS 协议 工作 原理 


CIFS 协议 是 一 个 状态 协议 ， 在 0SI 模型 的 应 用 /表示 层 工 作 ， 图 9-10 给 出 CIFS 协 
议 交 互 过 程 ， 它 包括 协议 协商 、 会 话 建立 、 连 接 建 立 、 文 件 操 作 等 步骤 。 当 客户 端 应 用 
程序 访问 过 程 故 障 中 断 时 ， 用 户 必 须 重 新 建立 CIFS 连接 。CIFS 运行 在 TCP/ IP 上 ,使 


用 DNS 域名 服务 进行 名 称 解 析 。 








客户 端 
SMB2 NEGOTIATE 
清光 } 央 
SMB2 NEGOTIATE 响应 协商 
SMB2 SESSION_SETUP 请 求 是 训 
SMB2 SESSION SETUP 响应 } 会 话 
SMB2 TREECONNECT 请 求 
SMB2 TREECONNECT 响应 } 连接 
} 网 络 
文件 
OE NIA DN 操作 _ 
SMB2 TREE_DISCONNECT 请 求 } 断 开 
SMB2 TREE_DISCONNECT 响应 


图 9-10 CIFS 协议 工作 原理 


服务 器 


| 协议 1 
| 报 儿 sa 
Le | 
| 安全 ) 
| WR he 


CIFS 是 否 可 以 自动 恢复 连接 并 重新 打开 被 中 断 的 文件 ， 取 决 于 应 用 程序 是 否 启用 
CIFS 的 容错 特性 。CIFS 服务 器 会 维护 每 个 客户 端的 相关 连接 信息 ， 因 此 CIFS 是 一 个 有 
状态 的 协议 。 在 网 络 故障 或 CIFS 服务 器 故障 的 情况 下 ,客户 端 会 接收 到 一 个 连接 断 开通 
知 。 如 果 应 用 程序 能 通过 舱 入 式 智能 软件 来 恢复 连接 ， 则 中 断 影 响 最 小 化 ; 反之 ， 用 户 


必须 重新 建立 CIFS 连接 。 
2. CIFS 共享 环境 


利用 CIFS 协议 ，NAS 设备 以 目录 的 形式 把 文件 系统 共享 给 某 个 用 户 ， 该 用 户 可 以 查 
看 或 访问 给 予 其 权限 〈 如 只 读 、 读 写 、 只 写 等 ) 的 共享 目录 。CIFS 的 共享 环境 有 “无 域 ” 
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和 “AD 域 ” 两 种 。 图 9-11 所 示 为 无 域 环境 中 的 CIFS 共享 情形 ， 此 时 Windows 用 户 通过 
CIFS 协议 直接 访问 某 特 定 存 储 系统 。 


CIFS 共享 





Windows 系统 





存储 系统 
图 9-11 无 域 环 境 中 的 CIFS 共享 


图 9-12 所 示 为 AD 域 环境 中 的 CIFS 共享 情形 。AD 是 Active Directory 的 简称 ， 指 
的 是 Windows 网 络 中 的 目录 服务 ”。 随 着 越 来 越 大 的 局 域 网 和 广域网 规模 ， 利 用 AD 域 ， 
企业 能 够 更 加 便捷 地 实现 Windows 网 络 管理 。 存 储 系统 能 够 加 入 AD 域 ， 作 为 AD 域 的 客 
户 端 ， 实 现 和 AD 域 环境 的 无 颖 对 接 。AD 域 控制 器 中 保存 了 域 环境 中 所 有 的 用 户 信 息 、 
群 组 信息 等 。AD 域 客户 端 访问 存储 系统 提供 的 CIFS 共享 时 ， 需 要 进行 身份 认证 ， 认 证 
操作 由 AD 域 控 制 器 完成 。 所 有 域 用 户 均 可 以 访问 存储 系统 提供 的 共享 目录 。AD 域 的 管 
理 员 甚至 可 以 进行 基于 文件 的 权限 管理 ， 对 不 同 域 用 户 访问 每 个 文件 夹 进行 不 同 的 权限 
控制 。 通 过 开启 Homedir 功能 ，AD 域 客 户 端 只 能 访问 与 其 名 称 相 同 的 共享 目录 ， 无 法 查 
看 并 访问 其 他 域 客户 端的 共享 目录 。 
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图 9-12 AD 域 环境 中 的 CIFS 共享 
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3.CIFS 协议 的 优点 

CIFS 具有 如 下 优点 。 

高 并 发 性 : CIFS 提供 文件 共享 和 文件 锁 机 制 ， 允 许多 个 客户 端 访问 或 更 新 同一 个 文 
件 而 不 产生 冲突 。 利 用 文件 锁 机 制 同一 时 刻 只 允许 一 个 客户 端 更 新 文件 。 

高 性 能 : 客户 端 对 共享 文件 进行 的 操作 并 不 会 立即 写 入 存储 系统 ， 而 是 保存 在 本 地 
缓存 中 。 当 客户 端 再 次 对 共享 文件 进行 操作 时 ， 系 统 会 直接 从 缓存 中 读 取 文件 ， 提 高 文 
件 访问 性 能 。 

数据 完整 性 : CIFS 采用 抢占 式 缓存 、 预 读 和 回 写 的 方式 保证 数据 的 完整 性 。 客 户 端 
对 共享 文件 进行 的 操作 并 不 会 立即 写 入 存储 系统 ， 而 是 保存 在 本 地 缓存 中 。 当 其 他 客户 
端 需要 访问 同一 文件 时 ， 保 存在 客户 端 缓存 中 的 数据 会 被 写 入 存储 系统 中 ， 这 时 需要 保 
证 同一 时 刻 只 有 一 个 拷贝 文件 处 于 激活 状态 ， 防 止 出 现 数据 不 一 致 性 的 冲突 。 

高 安全 性 : CIFS 支持 共享 认证 ， 通 过 认证 管理 ， 设 置 用 户 对 文件 系统 的 访问 权限 ， 
保证 文件 的 机 密 性 和 安全 性 。 

应 用 广泛 性 : 支持 CIFS 协议 的 任意 客户 端 均 可 以 访问 CIFS 共享 空间 。 

统一 的 字符 编码 标准 : CIFS 支持 各 类 字符 集 ， 保 证 CIFS 可 以 在 所 有 语言 系统 中 
使 用 。 


9.3.2 NFS 协议 


NFS 协议 是 由 SUN 公司 开发 的 用 于 异 构 平台 之 间 的 文件 系统 共享 协议 ， 其 在 网 络 环 
境 中 提供 分 布 式 文件 共享 服务 。 

1. NFS 协议 原理 

NFS 使 用 客户 端 / 服 务 器 架构 。 服 务 器 程序 向 其 他 计算 机 提供 对 文件 系统 的 访问 ， 客 
户 端 程序 对 共享 文件 系统 进行 访问 。NFS 通过 网 络 让 不 同类 UNIX 操作 系统 (如 ， 
Linux/UNIX/AIX/HP-UX/Mac 0S) 的 客户 端 彼此 共享 文件 。 与 CIFS 不 同 ，NFS 是 一 个 无 
状态 协议 。 当 客户 端 应 用 程序 访问 过 程 故 障 中 断 时 ， 系 统 能 自动 恢复 工作 。 

NFS 支持 面向 流 的 协议 〈TCP) 或 者 面向 数据 报 的 协议 (UDP)， 如 图 9-13 所 示 。 通 
过 NFS 网 络 共享 协议 ， 客 户 端的 应 用 可 以 像 使 用 本 地 文件 系统 一 样 使 用 远程 NFS 服务 端 
的 文件 系统 。 

远程 过 程 调用 (Remote File System，RPC) 的 主要 功能 是 向 客户 端 回复 每 个 NFS 
功能 所 对 应 的 端口 号 ， 以 实现 客户 端的 正确 连接 。 当 启用 NFS 后 ，NAS 设备 会 主动 向 RPC 
注册 自己 随机 选用 的 数 个 端口 ， 然 后 由 RPC 监听 客户 端的 请 求 并 回复 相应 端口 号 。 监 控 
过 程 RPC 使 用 111 指定 端口 。 启 动 NFS 之 前 须 先 启动 RPC 机 制 ， 否 则 NFS 端口 号 注册 将 
失败 。 
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图 9-13 NFS 协议 工作 原理 


2. NFS 共享 环境 

基于 NFS 的 NAS 系统 支持 三 种 共享 环境 : 1) 无 域 环境 下 NFS 共享 ; 2) LDAP 域 环 境 
下 NFS 共享 ; 3) NIS 域 环境 下 NFS 共享 。 

在 无 域 环境 下 ， 存 储 系统 作为 NFS 服务 器 ， 通 过 NFS 协议 向 客户 端 提供 对 文件 系统 
的 共享 访问 。 客 户 端 将 共享 文件 挂 载 到 本 地 后 ， 用 户 像 访 问 本 地 文件 系统 一 样 远程 访问 
服务 器 中 的 文件 系统 。 在 服务 器 端 设置 客户 端 标识 后 ,可 访问 该 文件 系统 的 客户 端 信息 ， 
如 图 9-14 所 示 。 


Mac OS 客户 端 
/volumes/mnt 


LinuxfUNIX 等 
客户 端 /mnt 


Vmware 服务 器 
/mnt/date 





Windows 系统 
图 9-14 无 域 环境 下 NFS 共享 


随 着 网 络 应 用 的 日 益 丰 富 ， 用 户 管理 成 本 越 来 越 高 也 越 来 越 复杂 。 相 对 于 提供 单一 
服务 的 系统 来 说 ， 采 用 “用 户 名 一 密码 ”的 认证 方式 是 相对 成 熟 的 方案 。 网 络 中 的 各 种 
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应 用 对 每 个 用 户 有 不 同 的 权限 ， 这 导致 对 每 个 用 户 或 每 个 应 用 都 需要 设 定 不 同 的 用 户 名 
和 密码 。 对 于 不 同 的 应 用 系统 ， 用 户 需 要 输入 不 同 的 用 户 名 和 密码 ， 过 程 不 仅 烦琐 ， 而 
且 不 易 管理 。 针 对 此 类 问题 ， 轻 量 级 目录 访问 协议 (Lightweight Directory Access 
Protocol，LDAP) 被 用 于 支持 多 应 用 系统 下 的 目录 服务 ”。 

由 于 其 具有 简单 、 安 全 、 优 秀 的 信息 查询 功能 ， 并 且 支 持 跨 平台 的 数据 访问 ，LDAP 
已 逐渐 成 为 网 络 管理 的 重要 工具 。 基 于 LDAP 的 认证 应 用 主要 是 实现 一 个 以 目录 为 核心 的 
用 户 认证 系统 ， 即 LDAP 域 环 境 。 相 比 无 域 环 境 下 NFS 共享 ，LDAP 域 环境 下 NFS 共享 多 
了 一 道 认证 环节 。 如 图 9-15 所 示 ， 在 LDAP 域 环 境 中 ， 当 用 户 需 要 访问 应 用 程序 时 ， 客 
户 端 将 用 户 名 和 密码 提供 给 LDAP 服务 器 ，LDAP 服务 器 将 其 与 目录 数据 库 中 的 认证 信息 
进行 比 对 来 确定 用 户 身份 的 合法 性 。 


了 ] Linux/UNIX 等 
客户 端 /mnt 


图 9-15 LDAP 域 环境 下 NFS 共享 
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在 一 个 独立 应 用 的 局 域 网 系统 中 ， 如 果 不 同 的 主机 分 别 维护 各 自 的 网 络 信息 ， 包 括 
用 户 名 、 密 码 、 主 目录 、 组 信息 等 ， 一 旦 网 络 信息 需要 更 改 ， 将 是 非常 复杂 的 事情 。 网 
络 信息 服务 (Network Information Service，NIS) 是 一 种 可 以 集中 管理 系统 数据 库 的 
目录 服务 技术 ， 其 提供 了 一 个 网 络 黄页 的 功能 ， 为 网 络 中 所 有 的 主机 提供 网 络 信息 “ 。 
NIS 使 用 客户 端 /服务 器 架构。 如 果 某 个 用 户 的 用 户 名 以 及 密码 保存 在 NIS 服务 器 中 
的 数据 库 中 ，NIS 允许 此 用 户 在 NIS 客户 端 上 登录 ， 并 且 可 以 通过 维护 NIS 服务 器 中 
的 数据 库 ， 统 一 管理 整个 局 域 网 系统 中 的 网 络 信息 。 如 图 9-16 所 示 为 NIS 域 环境 下 NFS 
共享 。 


= = 


第 9 章 NAS 技术 介绍 


Ne 
| 一 
| 管理 网 口 站 -一 SS 


| 

| 

| 

| 

| 

| 

| 

| 

| 

全 ~ | 

SR Re < | 

\ Mac OS 客户 端 | 
“ 枯 \ /volumes/mnt | 

NFS a | 
= \ | 
| 

| 

| 

| 

| 

| 

| 








\ 
A J] Linux/UNIX 等 
客户 端 /mnt 


图 9-16 NIS 域 环境 下 NFS 共享 


3. NFS 协议 的 优点 

NFS 协议 具有 如 下 几 方 面 的 优点 。 

高 并 发 性 : 多 台 客 户 端 可 以 使 用 同一 文件 ， 以 便 网 络 中 的 不 同 用 户 都 可 以 访问 相同 
的 数据 。 

易 用 性 : 文件 系统 的 挂 载 和 远程 文件 系统 的 访问 对 用 户 是 透明 的 ， 当 客户 端 将 
共享 文件 系统 挂 载 到 本 地 后 ， 用 户 像 访 问 本 地 文件 系统 一 样 远程 访问 服务 器 中 的 文 
件 系 统 。 


9.3.3 CIFS 与 NFS 协议 对 比 


CIFS 协议 和 NFS 协议 都 需要 转换 不 同 操作 系统 之 间 的 文件 格式 。 如 果 文 件 系 统 已 经 
设置 为 CIFS 共享 ,再 添加 NFS 共享 ， 则 NFS 共享 只 能 设置 为 只 读 。 与 此 类 似 ， 如 果 文 件 
系统 已 经 设置 为 NFS 共享 ， 再 添加 CIFS 共享 ， 则 CIFS 共享 只 能 设置 为 只 读 。 

表 9-1 列 出 CIFS 和 NFS 协议 的 各 项 对 比 。 

(1) 平台 ; NFS 主要 运行 UNIX 系列 的 平台 ; CIFS 主要 运行 星 ndows 系列 的 平台 。 

(2) 软件 ，NFS 的 客户 端 必须 配备 专用 软件 ，CIFS 被 集成 到 操作 系统 中 ， 不 需要 额 
外 的 软件 。 

(3) 底层 网 络 协 议 : NFS 使 用 TCP 或 UDP 传输 协议 ; CIFS 是 一 个 基于 网 络 的 共享 协 
议 ， 其 对 网 络 传输 的 可 靠 性 要 求 很 高 ， 所 以 它 通常 使 用 TCP/IP 传输 协议 。 
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(4) 故障 影响 ，NFS 是 无 状态 的 协议 ， 可 在 连接 故障 后 有 CIFS 是 一 
有 状态 的 协议 ， 连 接 故 障 时 不 能 自动 恢复 连接 。 

(5) 效率 : 由 于 NFS 是 无 状态 的 协议 ， 每 次 进行 RPC 注册 时 都 要 发 送 较 多 的 元 余 信 
息 ,效率 较 低 ; 而 CIFS 是 有 状态 协议 ， 仅 发 送 少 许 的 宛 余 信息 ， 因 此 具有 比 NFS 更 高 的 
传输 效率 。 

表 9-1 CIFS 与 NFS LU 


操作 系统 集成 不 | 上 
TCP/IP | 需要 其 他 软件 加 本 Windows 





和 | ww | 小 : 交互 进程 中 断 可 


9.4 NAS I/O 访问 路 径 


NFS 和 CIFS 协议 支持 访问 远程 文件 系统 的 文件 存 取 请 求 , 其 1/0 过 程 由 NAS 设备 进 
行 管理 。NAS 1/0 的 过 程 如 图 9-17 所 示 。 






存储 阵列 


es es Se i a i et et 


客户 端 IP 网 络 NAS 设备 
图 9-17 NAS 1/0 流程 


De 


(1) 客户 端的 1/0 请 求 到 达 TCP/IP' 协 议 栈 ， 封 装 成 TCP/IP 报 文 ， 并 通过 协议 栈 转 
发 出 去 ，NAS 设备 从 网 络 接收 此 请 求 。 

(2) NAS 设备 把 收 到 的 1/0 请 求 转换 为 对 应 的 物理 存储 请 求 ， 即 块 级 1/0 请 求 ， 然 
后 对 物理 存储 池 执 行 相应 的 操作 。 

(3) 当 请 求 数 据 块 从 物理 存储 池 返 回 时 ，NAS 设备 处 理 返回 数据 并 重新 打包 、 封 装 ， 
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将 数据 转换 成 相应 的 文件 协议 数据 单元 。 

(4) 通过 TCP/IP 传输 协议 ，NAS 设备 将 协议 数据 单元 返回 给 客户 端 。 

NAS 设备 与 服务 器 、 客 户主 机 的 应 用 业务 共享 同一 网 络 一 一 局 域 网 CLAN)， 因 此 增 
加 了 网 络 流量 ， 造 成 网 络 的 负担 ， 容 易 导 致 拥塞 。 由 于 网 络 共用 ，NAS 本 身 的 传输 能 力 
也 受到 限制 ，LAN 的 性 能 通常 是 NAS 系统 的 性 能 瓶颈 。 





9.5.1 NAS 优点 


NAS 具有 如 下 优点 。 

(1) 支持 全 面 的 获取 信息 : NAS 实现 高 效 的 文件 共享 ， 既 支持 多 个 客户 端 同时 访问 
一 个 NAS 设备 ， 也 支持 一 个 客户 端 同 时 连接 多 个 NAS 设备 。 

(2) 高 访问 效率 : NAS 设备 使 用 专用 的 操作 系统 提供 文件 服务 ， 相 比 通用 服务 器 的 
文件 服务 操作 ，NAS 设备 具有 更 高 的 访问 效率 。 

(3) 高 应 用 灵活 性 : NAS 使 用 行业 标准 协议 ， 支 持 UNIX 客户 端 和 凡 ndows 客户 端 。 
不 同类 型 的 客户 端 能 够 访问 同一 存储 资源 。 

(4) 集中 式 存 储 : 数据 进行 集中 存储 ， 减 少 客户 端的 数据 量 ， 简 化 数据 管理 。 

(5) 可 扩展 性 : 根据 不 同 的 利用 率 配置 和 各 种 业务 应 用 可 提供 高 性 能 、 低 延迟 扩展 。 

(6) 高 可 用 性 : NAS 设备 可 以 使 用 集群 技术 用 于 故障 切换 。NAS 使 用 元 余 的 网 络 组 
件 ， 提 供 多 连接 选项 。NAS 还 具有 复制 功能 和 恢复 选项 ， 可 实现 数据 的 高 可 用 性 。 

(7) 安全 : NAS 通过 身份 认证 、 文 件 锁定 和 安全 架构 三 者 相 结合 的 方式 确保 数据 安 
全 性; 


9.5.2 NAS 和 SAN 对 比 


图 9-18 给 出 NAS 和 SAN 两 种 存储 架构 ， 二 者 都 具有 良好 的 扩展 性 ， 便 于 扩展 。 然 
而 ， 二 者 具有 明显 区 别 。 

服务 方式 : NAS 提供 文件 级 的 数据 访问 和 存储 服务 ， 而 SAN 提供 块 级 数据 访问 和 在 
储 服 务 。 

文件 系统 所 在 位 置 : NAS 的 文件 系统 集成 在 NAS 设备 上 ， 而 SAN 的 文件 系统 集成 在 
主机 侧 。 

访问 性 能 : NAS 与 业务 应 用 共享 网 络 ， 占 用 LAN 网 络 带宽 资源 ， 既 影响 业务 ， 也 限 
制 NAS 传输 能 力 ; SAN 采用 专用 的 存储 网 络 ， 不 占用 LAN 带宽 资源 ， 提 高 传输 性 能 。 
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图 9-18 NAS 与 SAN 架构 


9.6 NAS 产品 介绍 


1. OceanStor 9000 

0ceanStor 9000 作为 大 数据 存储 产品 ， 具 有 大 容量 、 高 性 能 和 易 扩 展 性 等 方面 的 突 
出 优势 ， 能 为 用 户 提 供 数据 资源 共享 服务 ， 能 够 支持 广电 媒体 、 卫 星 测绘 、 基 因 测 序 、 
能 源 勘探 、 科 研 教育 等 多 种 数据 业务 ， 适 用 于 高 性 能 计算 、 数 据 中 心 、 互 联网 运营 等 
领域 。 

0ceanStor 9000 可 被 看 作 统 一 型 NAS 系统 ， 但 是 与 使 用 专用 设计 的 存储 架构 不 同 ， 
0ceanStor 9000 采用 多 个 通用 X86 架构 服务 器 来 构建 NAS 集群 ， 如 图 9-19 所 示 。 其 具 
有 性 能 、 容 量 和 可 扩展 性 优势 。 

2. Lsilon IQ 

EMC 提供 一 系列 的 集群 存储 解决 方案 Isilon””"， 其 中 Isilon IQ 支持 可 扩展 的 分 布 
式 文件 系统 OneFS， 它 将 三 个 传统 存储 架构 层 〈 即 文件 系统 、 卷 管理 器 和 RAID) 组 合成 
一 个 统一 的 软件 层 ， 从 而 创建 了 一 个 智能 的 完全 对 称 文 件 系统 ， 该 系统 横 跨 集群 内 的 所 
有 节点 。 

从 图 9-20 可 知 ，Isilon IQ 横向 扩展 NAS 集成 了 对 多 种 行业 标准 协议 的 支持 ， 包 括 
NFS、CIFS、HTTP、FTP 等 。 利 用 横向 扩展 ，NAS 可 以 扩展 单个 集群 的 容量 一 一 每 个 群集 
的 容量 高 达 50 PB。OneFS 能 够 高 效 管理 集群 中 的 所 有 组 件 ， 创 建 统 一 的 高 效 存储 池 ， 并 
支持 超过 80% 的 存储 利用 率 。 
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本 章 介 绍 了 网 络 附加 存储 NAS 的 存储 架构 ， 其 整体 架构 由 NAS 引擎、 网络 接口 卡 、 
操作 系统 、 文 件 共享 协议 、 磁 盘 资 源 、IP 网 络 组 成 。 本 章 还 介绍 了 统一 型 NAS 和 网 关 型 
NAS 两 种 实现 方式 ， 统 一 型 NAS 由 NAS 管理 软件 管理 后 端 存储 设备 ， 网 关 型 NAS 由 存储 
阵列 管理 后 端 存储 设备 。 本 章 重 点 介绍 了 UNIX 下 NEFS 和 Windows 下 CIFS 这 两 种 典型 NAS 
文件 共享 协议 ， 并 从 扩展 性 、 服 务 方式 、 文 件 系 统 所 在 位 置 、 性 能 等 方面 对 NAS 和 SAN 
进行 了 对 比 ， 最 后 介绍 了 两 种 采用 NAS 架构 的 存储 产品 。 
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一 、 判 断 题 

1. NAS 在 传输 文件 时 ， 对 业务 网 络 的 影响 比 SAN 小 。( ) 

2. CIFS 协议 支持 故障 连接 的 断 开 自 动 重 连 。( ) 

二 、 选 择 题 

1. 以 下 有 关 存 储 文件 系统 的 说 法 错误 的 是 ) 

A. NAS 文件 系统 包括 CIFS、NFS 等 

B. SAN 文件 系统 允许 不 同 操作 系统 的 多 个 服务 器 共享 存储 在 公共 存储 介质 上 的 相同 


C. CIFS 是 NAS 存储 设备 在 UNIX 环境 下 的 文件 共享 方式 

D. NFS 是 NAS 存储 设备 在 Linux 环境 下 的 文件 共享 方式 

2. NAS 的 使 用 的 网 络 传输 协议 是 〈 

A. TCP/IP B. UDP C. FC D. IPX 

3. NAS 使 用 的 文件 共享 协议 是 ( ) 

A. FTP B. HTTP C. CIFS D. HTTPS 

三 、 填 空 题 

1. NAS 的 文件 共享 协议 中 NFS 的 共享 环境 有 ( Xt 和 ) 
三 种 ，CIFS 的 共享 环境 有 ( 7 《 Ys 

2. NAS 的 组 成 包括 ( 过 Js 区 ys * 轴 
( 区 法 

四 、 思 考题 


1. NAS 的 实现 方式 有 哪些 ， 管 理 方式 上 有 什么 不 同 ? 


2. NAS 与 SAN 有 什么 区 别 ? 
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博客 、 社 交 网 络 、 云 计算 、 物 联网 等 新 兴 服 务 促使 人 类 社会 的 数据 种 类 和 规模 以 前 
所 未 有 的 速度 发 展 ， 大 数据 时 代 正 式 到 来 ， 而 数据 也 从 一 种 简单 处 理 对 象 转变 为 基础 资 
源 。 一 方面 ， 如 何 更 好 地 存储 、 管 理 、 分 析 和 利用 大 数据 已 成 为 科研 界 和 产业 界 共同 关 
注 的 话题 ， 另 一 方面 ， 大 数据 的 规模 效应 给 数据 存储 、 管 理 及 分 析 利 用 带 来 了 极 大 的 技 
术 挑 战 。 本 章 主要 介绍 大 数据 的 由 来 、 定 义 、 组 成 、 特 征 以 及 处 理 方式 等 ， 并 概述 大 数 
据 相 关 知识 和 大 数据 管理 系统 的 设计 需求 。 


ES 
学 号 2 。 掌 握 大 数据 的 定义 ; 
习 SS 。 掌握 大 数据 的 组 成 、 价 值 
Ro 。 了 解 大 数据 的 特征 ; 
 。 掌握 大 数据 的 处 理 方式 。 








随 着 网 络 信息 化 时 代 的 到 来 ， 互 联网 、 物 联网 、 云 计算 等 技术 被 提出 并 飞速 发 展 ， 
各 种 类 型 的 移动 终端 也 不 断 被 普及 。 信 息 化 技术 不 仅 可 以 让 你 对 客观 世界 的 认识 更 进 一 
步 ， 而 且 让 你 更 加 理智 地 作出 决策 ， 不 再 依赖 主观 判断 和 过 往 经 验 。 信 息 数据 的 产生 已 
经 不 受 时 间 、 地 点 的 限制 ， 兴 许 你 的 一 个 习惯 动作 、 一 种 无 意 行 为 、 一 次 消费 行为 、 一 
份 就 诊 记 录 ， 都 正在 被 巨大 的 数字 网 络 串 联 起 来 。 
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博客 、 社 交 网 络 、 云 计算 、 物 联网 等 新 兴 服 务 促使 数据 以 前 所 未 有 的 速度 在 增长 和 
累积 ， 大 数据 时 代 已 经 正式 到 来 ”。 最 早 提出 “大 数据 ”时 代 到 来 的 是 全 球 知名 咨询 公 
司 麦 肯 锡 (McKinsey)。 麦 肯 锡 称 :“ 数 据 , 已 经 渗透 到 当今 每 一 个 行业 和 业务 职能 领域 ， 
成 为 重要 的 生产 因素 。 人 们 对 于 海量 数据 的 挖掘 和 运用 ， 预 示 着 新 一 波 生 产 率 增长 和 消 
费 者 一 余 浪 潮 的 到 来 ” 大 数据 在 军事 、 金 融 、 通 信 等 领域 存在 已 有 时 日 ， 却 因 近 年 来 互 
联网 和 信息 行业 的 发 展 而 备 受 关注 。 

大 数据 的 英文 名 为 “Big data”， 表 示 数 据 规模 很 庞大 ， 其 泛 指 无 法 在 一 定时 间 范 
围 内 用 常规 软件 工具 进行 捕捉 、 管理 和 处 理 的 数据 集合 。 下文 是 两 个 权威 机 构 / 协 会 给 出 
的 大 数据 定义 。 

高 德 纳 研究 咨询 公司 (Gartner) 对 大 数据 的 定义 是 :“Big Data is high-volume， 
high-velocity and/or high-variety information assets that demand cost-effective, 
innovative forms of information processing that enable enhanced insight， 
decision making，and process automation. ” 意思 为 “大 数据 是 指 需要 创新 的 信息 处 
理 模式 才能 具有 更 强 的 洞察 力 、 决 策 力 和 流程 优化 能 力 的 海量 、 高 增长 率 和 多 样 化 的 信 
息 资 产 ”。 

存储 网 络 工业 协会 (SNIA) 对 大 数据 的 定义 是 :“A characterization of datasets 
that are too large to be efficiently processed in their entirety by the most 
powerful standard computational platforms available. ”， 意 思 为 “数据 量 特别 巨大 ， 
在 最 强大 的 标准 计算 平台 上 都 无 法 对 全 部 数据 进行 有 效 处 理 的 数据 集 ”。 

从 上 述 定义 可 知 ， 大 数据 具有 如 下 特征 : 

(1) 数据 量 巨大 ， 且 增长 速度 很 快 ; 

(2) 具有 不 同 的 数据 类 型 (结构 的 化 数据 和 非 结 构 化 数据 ); 

(3) 大 数据 包含 重要 信息 ， 挖 据 提 取出 来 可 以 帮助 公司 进行 更 好 的 商业 运作 。 





10.2.1 大 数据 来 源 


从 世界 诞生 之 日 至 2003 年 ， 人 类 共 创 造 出 5EB 的 数据 ， 而 2011 年 产生 如 此 多 的 信 
息 量 只 需要 不 到 2 天 ，2013 年 产生 此 数据 量 只 需要 10 分 钟 ， 预 计 到 2020 年 ， 每 年 创造 
的 数据 容量 将 高 达 40ZB。2016 年 在 贵阳 举办 的 数 博 会 上 , 腾讯 董事 会 主席 马化腾 分 享 了 
腾讯 的 相关 大 数据 : 数据 中 心 存储 总 量 超过 1000PB， 超 过 15000 个 全 世界 最 大 图 书馆 的 
总 量 ， 而 且 每 天 以 500TB 的 数据 上 升 。 另 外 ， 腾 讯 的 图 片 、 视 频 以 及 移动 支付 ， 三 个 数 
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字 在 各 自 领 域 都 是 国内 第 一 ， 每 天 上 传 的 照片 数量 非常 惊人 ， 整 个 社交 网 络 视频 播放 量 
和 专业 视频 网 站 的 播放 量 也 正在 高 速 增 长 ， 移 动 支付 领域 ， 除 夕 时 红包 数量 每 天 超过 25 
亿 笔 ， 目 前 也 能 稳定 到 每 天 超过 5 亿 笔 。 这 里 ，TB、PB、EB 和 ZB 都 是 指 存储 容量 单位 ， 
有 具体 换算 见 下 文 。 

大 数据 的 诞生 是 信息 技术 发 展 的 必然 结果 。 如 交通 业 ， 初 期 需要 建设 道路 ， 当 道路 
发 展 到 一 定 里 程 ， 就 为 汽车 发 展 提供 了 基础 和 条 件 ; 当 汽 车 普及 时 ， 人 们 关注 的 焦点 变 
成 了 汽车 所 运输 的 货物 。 与 交通 业 相 似 ， 信 息 产 业 的 发 展 也 遵循 “道路 一 工具 一 货物 ” 
这 个 轨迹 。 宽 带 网 络 建设 是 信息 高 速 公 路 ， 物 联网 、 云 计算 等 技术 相当 于 汽车 和 仓库 ， 
而 大 数据 则 是 “货物 ”。 

如 图 10-1 所 示 ， 数 据 快速 增长 的 原因 是 多 方面 的 ， 下 面 列 出 儿 个 重要 因素 。 
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图 10-1 大 数据 来 源 


(1) 智能 终端 普及 。 过 去 几 年 ， 智 能 手机 、 平 板 电脑 、 摄 像 机 、 照 相机 等 终端 设备 
充斥 着 人 们 的 生活 和 工作 。 据 统计 ， 目 前 世界 上 有 60 亿 部 手机 在 使 用 , 手机 基本 上 都 内 
置 了 高 分 辩 率 的 摄像 头 , 单 张 照片 的 分 辨 率 是 5 年 前 的 10 倍 , 借助 智能 手机 的 音 视 频 硬 
件 ， 人 们 创建 了 越 来 越 多 的 社交 媒体 数据 ， 例 如 与 他 人 分 享 图 片 、 音 频 、 视 频 等 文件 。 

(2)- 物 联网 飞速 发 展 。 物 联网 将 世界 上 越 来 越 多 的 智能 设备 连接 到 全 球 网 络 中 ， 例 
如 大 量 的 网 络 摄像 头 和 打印 机 。 另 外 ， 未 来 将 会 出 现 更 多 的 智能 设备 ， 如 智能 家 电 、 车 
载 设备 、 工 业 领 域 的 RFID 系统 等 。 可 以 预计 , 在 不 远 的 将 来 , 物 联 网 会 产生 更 多 的 数据 。 

(3) 互联 网 和 高 速 宽带 。 在 科技 史上 ， 互 联网 可 以 和 “ 火 ” 与 “ 电 ” 的 发 明 相 媲美 。 
互联 网 将 孤立 计算 机 连接 起 来 ， 改 变 了 人 们 生活 ， 成 为 人 们 获取 数据 的 首要 渠道 ， 也 成 
为 人 们 共享 数据 的 重要 途径 。 另 外 ， 传 输 数 据 的 网 络 在 持续 不 断 地 升级 ， 客 观 上 加 速 了 
数据 量 的 增长 ， 比 如 ， 现 在 每 个 人 都 习惯 用 宽带 上 网 ，46 无 线 网 络 已 经 广泛 使 用 ， 使 得 
共享 数据 变 得 快速 而 方便 。 
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(4) 云 计 算 。 在 云 计 算出 现 之 前 ， 数 据 大 多 分 散 存储 在 个 人 电脑 或 公司 服务 器 中 。 
云 计 算 的 出 现 改 变 了 数据 的 存储 和 访问 方式 ， 绝 大 部 分 数据 被 集中 存储 到 “数据 中 心 ”， 
即 所 谓 的 “云端 "。 各 大 银行 、 大 型 互联 网 公司 、 电 信行 业 都 拥有 各 自 数据 中 心 ， 实 现 了 
全 国 级 数据 访问 和 管理 。 从 而 ， 云 计算 客观 上 为 大 数据 提供 了 存储 空间 和 访问 渠道 。 

(5) 社交 网 络 。 社 交 媒 体 的 兴起 是 互联 网 发 展 史上 一 个 重要 里 程 碑 ， 它 将 人 类 社会 
真实 的 人 际 关 系 完 美 地 映射 到 互联 网 空间 。 例 如 ， 通 过 社交 网 络 ， 人 们 可 以 分 享 各 自 的 
喜 怒 衣 乐 ， 并 相互 传播 。 知 名 的 社交 媒体 有 微 博 、 微 信 、Facebook 等 。 

通常 采用 TB 量 级 来 统计 大 的 数据 量 ， 然 而 ， 现 有 大 数据 的 数据 量 已 经 难以 用 TB 表 
示 ， 而 是 使 用 新 的 单位 ， 如 EB、2B。 


lB = 8 bit 

1KB = 1024B 寺 1000byte 

1MB = 1024KB 守 1 000. 000byte 

1GB = 1024MBs*1 000 000 000byte 

1TB = 1024GB 守 1 000 000 000 000byte 

1PB = 1024TB 守 1 000 000 000 000 000byte 

lEB = 1024PB 守 1 000 000 000 000 000 000byte 

1ZB = 1024EB 守 1 000 000 000 000 000 000 000byte 

1YB = 1024ZB 守 1 000 000 000 000 000 000 000 000byte 


10.2.2 大 数据 内 容 类 型 


根据 数据 结构 特征 ， 大 数据 主要 分 为 如 下 三 种 类 型 ， 结构 化 数据 、 非 结构 化 数据 和 
半 结 构 化 数据 ， 如 图 10-2 所 示 。 


非 结 构 化 数据 





图 10-2 大 数据 的 分 类 


能 够 用 数据 或 统一 的 结构 加 以 表示 ， 可 以 用 二 维 表 结 构 来 逻辑 表达 实现 的 数据 ， 
我 们 称 为 结构 化 数据 ， 如 数字 、 符 号 。 它 就 是 传统 的 关系 数据 模型 中 的 行 数据 ， 财 务 
系统 、 企 业 资 源 计划 系统 (Enterprise Resource Planning，ERP)、 客 户 关系 管理 系 
统 (Customer Relationship Management，CRM) 等 应 用 在 数据 库 中 存储 的 都 是 结构 


化 数据 。 
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非 结构 化 数据 是 指 字 段 长 度 可 变 ， 不 方便 采用 结构 化 数据 来 逻辑 表达 的 数据 。 非 结 
构 化 数据 包括 全 文 文本 、 办 公文 档 、 图 像 、 图 片 、 声 音 、 音 频 、 影 视 、 视 频 和 各 类 报表 
等 数据 。 | 

半 结 构 化 数据 是 结构 化 数据 的 一 种 表达 形式 ， 它 是 位 于 结构 化 数据 和 完全 无 结构 
(如 声音 、 图 像 文件 等 ) 之 间 的 数据 。 在 半 结 构 化 数据 中 属于 同一 类 集合 可 以 有 不 同 的 属 
性 ， 即 使 他 们 被 组 合 在 一 起 ， 这 些 属 性 的 顺序 并 不 重要 。 它 可 以 自由 地 传达 出 很 多 需要 
的 信息 ， 所 以 半 结 构 化 数据 具有 很 好 的 扩展 性 。 典 型 应 用 场景 包括 邮件 系统 、Web 集群 、 
教学 资源 库 、 数 据 挖掘 系统 、 档 案 系统 等 。 

图 10-3 和 图 10-4 所 示 为 结构 化 数据 、 非 结构 化 数据 、 半 结构 化 数据 在 互联 网 公司 
及 电信 运营 商 所 占 的 比重 。 可 以 看 出 ， 不 同 结构 数据 在 不 同 领域 所 占 的 比重 各 有 不 同 ， 
非 结构 化 数据 在 互联 网 公司 所 占 的 比重 远 远 高 于 结构 化 数据 ， 结 构 化 数据 在 电信 运营 商 
所 占 的 比重 远 远 高 于 非 结 构 化 数据 。 
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图 10-3 互联 网 公司 数据 比重 分 布 
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10.2.3 大 数据 组 成 


在 全 球 新 增 的 数据 中 ， 非 结构 化 的 数据 所 占 比重 很 大 。 特 别 是 互联 网 应 用 中 ， 非 结 
构 化 数据 大 幅 增 长 。 例 如 ，2012 年 ， 全 球 结构 化 数据 增长 速度 约 为 32%， 而 非 结构 化 数 
据 增 速 高 达 63%。 截 至 2012 年 ， 非 结构 化 数据 占 整 个 数据 总 量 的 75% 以 上 ”。 图 10-5 
所 示 为 大 数据 构成 情况 ， 其 中 ， 非 结构 化 数据 主要 由 视频 、 音 乐 、 图 片 、 邮 件 、 数 据 文 
件 构 成 。 


非 结构 化 数据 75% “@ 





| 


图 10-5 大 数据 组 成 


本 章 10. 3 节 从 数据 的 角度 概括 大 数据 的 特征 ， 这 里 则 从 数据 使 用 者 的 角度 来 概括 
大 数据 。 

(1) 一 次 写 入 ， 较 少 修改 。 这 一 点 与 写 一 次 读 多 次 (Write Once Read Multiple， 
WORM) 负载 类 型 是 一 致 的 ， 保 存 之 后 主要 是 读 取 ， 很 少 编辑 。 具 体 数据 包括 视频 、 图 片 、 
音频 文件 等 。 

(2) 数据 价值 不 确定 。 数 据 价 值 可 能 因为 某 个 偶然 事件 而 增加 。 以 照片 和 视频 为 例 ， 
如 某 人 在 某 一 段 时 间 内 成 为 焦点 人 物 ， 那么 他 儿 时 照片 就 变 得 有 价值 。 视 频 监控 数据 也 有 
类 似 特 征 , 比如 , 帮助 公安 部 门 揭示 某 案件 真相 或 找到 犯罪 嫌疑 人 , 这 些 数 据 就 存在 价值 。 
数据 价值 很 难 评估 ， 有 可 能 是 有 用 的 ， 也 有 可 能 是 无 用 的 ， 但 你 不 能 轻易 把 它 扔 掉 。 

(3) 占用 容量 大 ， 增 长 速度 快 。 数 码 相机 和 智能 手机 拍摄 的 照片 迅猛 增长 ， 同 时 照 
相机 的 分 状 率 也 在 不 断 增加 ， 从 而 导致 了 需要 存储 的 数据 量 猛 增 。 

(4) 需要 保存 时 间 长 。 有 些 数据 可 能 要 保存 几 十 年 ， 甚 至 更 长 时 间 ， 这 就 需要 存储 
介质 能 保存 数据 很 多 年 ， 比 如 ， 家 庭 合 影 和 长 辈 照片 都 具有 非常 高 的 纪念 意义 ， 需 要 长 
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久保 存 。 
10.2.4 大 数据 价值 


大 数据 时 代 以 前 ， 人 们 使 用 数据 的 目的 主要 是 分 析 过 去 到 现在 发 生 了 什么 、 为 什么 
会 发 生 ， 并 作出 报告 。 而 大 数据 的 核心 在 于 “预测 ” 预测 是 基于 “数据 之 间 的 关联 性 ” 
而 非 “ 为 什么 是 这 样 的 因果 性 ” 并 按照 预测 出 来 的 趋势 去 响应 、 使 用 这 些 结果 。 图 10-6 
给 出 二 者 区 别 。 


泗 怀 淮 苇 


| 将 会 发 生 什么 ? 
优化、 预测 分 析 





1980 1990 2000 2010 


图 10-6 大 数据 价值 


通过 对 大 数据 的 分 析 ， 从 中 发 现 数据 所 绚 涵 的 有 价值 的 规律 ， 从 而 预测 未 来 ， 
这 是 一 种 非常 有 意义 的 活动 。 例 如 : Google 早 在 2008 年 推出 了 “流感 趋势 ”网 站 ， 
其 建立 的 前 提 和 假设 是 : 相 比 在 身体 健康 时 ， 人 们 会 在 遭受 疾病 困扰 时 花 更 多 的 时 
间 去 搜索 疾病 相关 内 容 ， 在 此 基础 上 ， 通 过 分 析 一 个 国家 在 特定 时 期 的 流感 相关 搜 
索 量 ， 便 可 以 推算 出 该 国家 的 流感 病毒 传播 情况 。 结 果 表 明 ，Google 流感 趋势 预测 
与 美国 疾病 控制 和 预防 中 心 〈CDC) 的 数据 相差 无 几 。 事 实 上 ， 几 次 传染 病 初期 的 
预测 甚至 比 CDC 早 了 一 周 之 入。 从而， 疾病 初期 预测 将 为 政府 及 时 采取 部 署 提供 有 
利 的 时 机 。 

2017 年 6 月， 菜鸟 网 络 和 顺丰 速 运 相互 关闭 平台 接口 ， 引 发 网 络 热 议 ， 最 后 在 国家 
邮政 局 的 干预 下 ， 双 方 同意 互通 物流 数据 接口 ， 全 面 恢复 业务 合作 和 数据 传输 。 这 场 物 
流 数据 之 争 最 终 以 和 和解 收场 ， 但 它 给 公众 揭示 了 一 个 信息 数据 是 有 价值 的 资产 ， 而 大 
数据 具有 巨大 的 商业 价值 。 

大 数据 正在 渗透 到 社会 组 织 的 每 一 个 细胞 ， 几 乎 对 所 有 行业 都 会 产生 颠覆 性 和 革命 
性 的 影响 。 但 仅仅 拥有 大 数据 是 不 够 的 ， 特 别 是 在 数据 质量 普遍 不 高 的 情况 下 ， 海 量 数 
据 产 生 的 同时 也 产生 了 大 量 的 数据 噪音 ， 我 们 需要 借助 理性 的 大 数据 管理 软件 对 大 数据 
进行 有 效 的 管理 和 分 析 ， 释 放大 数据 潜能 。 大 数据 为 企业 获得 更 为 深刻 、 全 面 的 洞察 能 
力 ， 提 供 了 前 所 未 有 的 空间 与 潜力 。 比 如 借助 大 数据 及 相关 技术 ， 可 获取 对 象 的 喜好 ， 
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行为 偏好 , 不 同 对 象 信息 , 然后 针对 不 同行 为 特征 的 客户 进行 针对 性 营销 , 甚至 能 从 “将 
一 个 产品 推荐 给 一 些 合适 的 客户 ”到 “将 一 些 合适 的 产品 推荐 给 一 个 客户 ”， 得 以 更 聚焦 
客户 ， 进 行 个 性 化 精准 营销 。 





大 数据 的 经 典 特 征 可 以 用 4 个“V” 来 归纳 : 海量 的 数据 规模 Volume)、 决 速 的 数 
据 流 转 和 动态 的 数据 体系 (Velocity)、 多 样 的 数据 类 型 (Variety) 和 巨大 的 数据 价值 
Valuey 

1， 巨 量 (Volume ) 

数据 量 大 是 大 数据 的 基本 属性 ， 根 据 国 际 数据 公司 〈《International Data Corporation， 
IDC) 的 定义 ,至少 要 有 超过 100TB 的 可 供 数据 分 析 的 数据 才能 称 得 上 大 数据 。 导 致 数据 
呈现 大 规模 增长 的 原因 有 和 很多， 比如， 互联 网 和 高 速 宽带 、 智 能 终端 普及 、 物 联网 快速 
发 展 、 云 计算 和 社交 网 络 等 。 

随 着 互联 网 技术 的 发 展 ， 使 用 网 络 的 企业 、 机 构 、 个 人 等 呈现 增长 的 趋势 ， 数 据 的 
获取 、 分 享 方式 越 来 越 简易 。 以 前 ， 只 有 少量 的 机 构 或 者 企业 通过 调查 、 取 样 的 方式 获 
取 数 据 ， 而 发 布 数据 的 机 构 也 是 有 限 的 ， 人 们 难以 在 较 短 的 时 间 内 大 量 获取 所 需 数据 。 
现 如 今 ， 用 户 通过 网 络 可 以 在 很 短 时 间 内 轻松 获得 所 需 数据 ， 用 户 有 意 的 分 享 和 无 意 的 
点 击 、 浏 览 操作 都 将 产生 大 量 的 数据 。 随 着 各 种 传感器 数据 获取 能 力 的 大 幅 提 高 ， 人 们 
获取 的 数据 越 来 越 接近 原始 事物 的 本 身 ， 描 述 同一 事物 的 数据 量 激增 ， 早 期 通过 表格 等 
方式 收集 、 存 储 、 整 理 的 数据 ， 大 多 存在 抽象 化 特点 ， 不 便于 用 户 进行 数据 分 析 。 此 外 ， 
随 着 人 们 思维 的 转变 ,， 人 们 获取 数据 的 方式 及 理念 也 发 生 了 变化 。 早期 人 们 受 限于 获取 、 
分 析 数 据 的 能 力 ， 较 多 地 采用 采样 方式 ， 以 少量 的 数据 来 近似 描述 事物 的 全 貌 ， 通 过 采 
样 方式 获取 到 的 样本 规模 量 较 小 ， 采 用 当时 的 技术 手段 来 进行 数据 管理 和 分 析 时 ， 存 在 
“如 何 通 过 正确 的 采样 方法 以 最 小 的 数据 量 分 析 事 物 整体 属性 ”这 一 问题 , 在 某 些 特定 的 
领域 , 采用 采样 方式 获取 的 数据 不 能 完全 描述 整个 事物 , 可 能 会 存在 分 析 的 数据 不 完整 、 
不 适用 等 问题 ， 导 致 分 析 结 果 与 实际 结果 恰恰 相反 。 因 此 ， 如 果 想 让 分 析 结 果 具 有 更 高 
的 精确 性 ， 就 必须 调 取 大 量 的 数据 ， 从 接近 事物 本 身 的 数据 开始 着 手 ， 从 更 多 的 细节 来 
解释 事物 本 身 所 具有 的 特征 。 

2. 速度 (Velocity ) 

大 数据 与 传统 海量 数据 区 别 的 一 个 重要 特征 是 二 者 存在 不 同 的 数据 处 理 速度 要 求 ， 
大 数据 的 数据 处 理 速 度 远 远 高 于 普通 海量 数据 的 处 理 速 度 ， 具 体 体现 在 如 下 两 个 方面 。 

其 一 ， 随 着 各 种 传感器 与 互联 网 络 的 飞速 发 展 ,信息 的 获取 、 数 据 的 产生 与 发 布 越 来 
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越 便 捷 , 产生 数据 的 途径 也 增多 。 新 数据 在 不 断 地 涌现 出 来 , 数据 呈现 爆炸 式 的 快速 增长 ， 
个 人 成 为 产生 数据 的 重要 主体 之 一 ， 快 速 增长 的 数据 量 需要 匹配 快速 的 数据 处 理 速度 ， 使 
得 获取 到 的 大 量 数据 得 以 有 效 利 用 ， 和 否则 ， 人 快速 增 长 的 数据 会 成 为 解决 问题 的 负担 。 

其 二 ， 有 些 数据 具有 时 效 性 。 在 数据 的 获取 过 程 中 ， 数 据 不 是 一 成 不 变 的 ， 而 是 随 
着 时 间 变 化 也 在 发 生变 化 ， 通 常 这 种 数据 的 价值 会 随 着 时 间 的 推移 呈现 降低 的 趋势 ， 如 
果 数 据 在 获取 时 间 内 没有 得 到 有 效 的 处 理 ， 就 会 失去 价值 。 

3. 多 样 性 (Variety ) 

数据 类 型 繁多 、 复 杂 多 变 是 大 数据 的 重要 特性 。 如 今 的 数据 类 型 早已 不 是 单一 的 文 
本 形式 ， 形 成 结构 化 数据 、 半 结构 化 数据 和 非 结构 化 数据 共存 的 局 面 。 在 数据 呈现 多 元 
化 《结构 化 数据 ， 非 结构 化 数据 ， 半 结构 化 数据 ) 的 背景 下 产生 的 大 数据 具有 多 样 性 。 

以 往 的 数据 通常 是 按照 原先 定义 的 结构 化 数据 来 存储 , 结构 化 数据 是 指 可 以 用 二 维 表 
结构 来 逻辑 表达 实现 的 数据 。 在 定义 结构 化 数据 的 过 程 中 ,忽略 一 些 在 特定 应 用 场景 下 可 
以 不 考虑 的 细节 , 抽取 有 用 信息 , 以 事先 分 析 好 的 数据 之 间 存 在 的 关联 属性 来 定义 构造 表 ， 
数据 最 终 以 表格 的 形式 保存 在 数据 库 中 ， 数 据 格式 统一 ， 以 后 不 管 产生 多 少 的 数据 量 ， 都 
将 根据 数据 构造 表格 来 存储 数据 。 这 种 形式 存储 的 结构 化 数据 , 呈现 大 众 化 、 标准 化 特点 ， 
使 得 处 理 传统 数据 的 复杂 度 呈 线性 增长 ,新 增 的 数据 可 以 通过 常规 的 技术 手段 进行 处 理 。 

而 随 着 互联 网 网 络 及 传感器 的 快速 发 展 ， 非 结构 化 数据 呈现 飞速 发 展 的 趋势 。 非 结 
构 化 数据 没有 统一 的 数据 结构 属性 ， 难 以 用 表 结 构 来 表示 及 存储 ， 在 记录 数据 数值 的 同 
时 还 需要 存储 数据 的 结构 ， 增 加 了 数据 存储 和 处 理 的 难度 。 但 非 结构 化 数据 在 很 多 领域 
所 占领 的 比重 是 非常 大 的 。 据 统计 ，75% 一 85% 数 据 都 为 非 结 构 化 数据 ， 比 如 ， 人 们 在 日 
常生 活 中 上 网 不 仅仅 是 看 新 闻 ， 发 送 电子 邮件 等 ， 还 会 通过 网 络 上 传 或 者 下 载 图 片 、 视 
频 等 数据 。 通 过 这 些 方式 所 产生 的 数据 就 构成 了 非 结构 化 数据 。 尽 管 非 结构 化 数据 的 增 
长 速度 远 高 于 结构 化 数据 和 半 结 构 化 数据 的 增长 速度 ， 但 并 不 意味 着 结构 化 数据 或 半 结 
构 化 数据 将 面临 被 淘汰 的 局 面 ， 具 体 的 使 用 情况 以 实际 的 应 用 场景 为 准 。 

4. 价值 (Value ) 

大 数据 是 一 个 宽泛 的 概念 ， 上 面 几 个 方面 的 特征 (Volume、Velocity、Variety) 
都 无 一 例外 地 突出 了 “大 ” 字 。 诚 然 ,“ 大 ”是 大 数据 的 一 个 重要 特征 ， 但 远 远 不 够 。 有 
一 种 观点 认为 大 数据 是 “在 多 样 的 或 者 大 量 的 数据 中 ， 迅 速 获取 信息 的 能 力 ””， 这 种 
观点 更 加 关注 大 数据 的 功用 ， 即 大 数据 能 帮助 人 们 干什么 ?10.2.4 小 节 提 到 ，Google 
曾 用 大 数据 提前 7 天 准确 预测 当年 的 流感 趋势 ， 这 种 “预测 ”能 力 体 现 了 大 数据 的 价值 。 

通常 ， 数 据 价值 的 高 低 与 数据 量 的 大 小 成 反比 。 传 统 的 结构 化 数据 按照 特定 的 应 用 
对 事物 进行 相应 的 抽象 ， 而 大 数据 在 获取 信息 时 不 会 对 事物 进行 抽象 、 归 纳 等 处 理 。 它 
会 获取 事物 全 部 细节 ， 在 分 析 时 直接 采用 获取 的 原始 数据 ， 保 留 了 数据 的 原始 面貌 ， 减 
少 了 采样 和 抽象 等 步骤 ， 但 在 分 析 的 过 程 中 多 少 会 引入 一 些 没 有 意义 的 信息 或 错误 的 信 
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悬 一 因此 ， 相 对 于 特定 场景 的 应 用 ， 大 数据 关注 的 非 结构 化 数据 的 价值 较 低 。 以 视频 为 
例 ， 一 部 数 小 时 的 视频 ， 在 连续 的 不 间断 监控 中 ， 大 量 的 数据 被 存储 起 来 ， 但 很 多 数据 
是 无 用 的 ， 对 于 特定 场景 的 数据 ， 有 用 的 数据 仅仅 只 有 一 两 秒 。 





“10.4 大 数 


大 数据 处 理 的 流程 与 一 般 数据 处 理 的 流程 基本 一 致 ， 包 括 数据 采集 、 数 据 存储 、 数 
据 管理 、 数 据 分 析 4 个 环节 ， 具 体 流程 如 图 10-7 所 示 。 按 照 信息 生命 周期 管理 的 理念 ， 
大 数据 的 技术 体系 可 以 细 分 为 大 数据 采集 与 预 处 理 、 大 数据 存储 、 数 据 管理 、 大 数据 分 
析 与 挖掘 和 大 数据 可 视 化 计算 。 


图 10-7 大 数据 处 理 流程 


数据 采集 : 利用 多 种 途径 、 方 法 和 工具 来 获取 所 需要 的 数据 ， 为 后 续 数 据 分 析 提 供 
依据 。 在 大 数据 的 背景 下 ， 需 要 关注 数据 采集 途径 、 数 据 采集 方法 、 数 据 采 集 工具 等 。 

根据 MapReduce 产生 数据 的 应 用 系统 分 类 ， 大 数据 的 采集 主要 有 4 种 来 源 : 管理 信 
息 系 统 、Web 信息 系统 、 物 理 信 息 系统 和 科学 实验 系统 。 管 理 信息 系统 指 企业 、 机 关内 
部 的 信息 系统 ， 如 事务 处 理 系统 、 办 公 自 动 化 系统 。Web 信息 系统 包含 互联 网 上 的 各 种 
信息 系统 ， 如 社交 网 站 、 社 会 媒体 、 搜 索引 警 等， 主要 用 于 构造 虚拟 的 信息 空间 ， 为 广 
大 用 户 提供 信息 服务 和 社交 服务 。 物 理 信 息 系统 是 指 关 于 这 种 物理 对 象 和 物理 过 程 的 信 
息 系统 ， 如 实时 监控 、 实 时 检测 ， 主 要 用 于 生产 调度 、 过 程控 制 、 现 场 指挥 、 环 境 保护 
等 。 科 学 实验 系统 是 一 种 采用 预 设 实 验 环境 的 物理 信息 系统 ， 主 要 用 于 学 术 研究 。 

数据 存储 : 对 采集 到 的 数据 进行 传输 和 存储 。 随 着 数据 呈 爆 炸 式 增长 ， 传 统 的 数 
据 存 储 方式 已 经 很 难 满足 大 数据 存储 的 需求 ， 因 此 需要 采用 新 技术 来 实现 大 数据 的 存 
储 需 求 。 

大 数据 给 存储 系统 带 来 了 三 个 方面 的 挑战 : (1) 存储 规模 大 ; (2) 存储 管理 复杂 ， 
需要 兼顾 结构 化 、 非 结构 化 和 半 结 构 化 数据 ; (3) 数据 种 类 繁多 。 这 些 挑战 对 存储 系统 
的 性 能 、 可 靠 性 等 指标 有 不 同 的 要 求 。 有 具体 地 ， 一 方面 ， 大 数据 环境 下 的 存储 软件 栈 需 
要 对 上 层 应 用 提供 高 效 的 数据 访问 接口 ， 能 够 存 取 PB 甚至 EB 量 级 的 数据 ， 能 够 在 可 接 
受 的 响应 时 间 内 完成 数据 的 存 取 ， 同 时 保证 数据 的 可 用 性 ， 男 一 方面 ， 对 底层 设备 ， 存 
储 软 件 栈 需要 充分 高 效 地 管理 存储 资源 ， 合 理 地 利用 设备 的 物理 特性 ， 以 满足 上 层 应 用 
对 存储 系统 性 能 和 可 靠 性 的 要 求 。 
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数据 管理 :数据 存储 的 延伸 。 在 数据 存储 的 基础 上 对 数据 进行 深加工 ， 进 一 步 实 现 
数据 细 分 ， 为 后 续 数据 分 析 提 供 直 接 可 用 的 元 数据 ， 提 升 数 据 分 析 的 效率 。 

大 数据 存储 中 ， 数 据 通 常 存储 在 分 散 的 设备 或 节点 上 ， 存 储 资源 通过 网 络 连 接 ， 并 
采用 分 布 式 文件 系统 对 大 数据 进行 存储 和 管理 。 相 应 地 ， 大 数据 管理 需要 涉及 以 下 几 个 
关键 技术 ; 1) 高 效 元 数据 管理 技术 ， 大 数据 应 用 下 ， 元 数据 的 规模 非常 大 ， 元 数据 的 存 
取 性 能 是 整个 分 布 式 文件 系统 性 能 的 关键 ; 2) 系统 弹性 扩展 技术 ， 大 数据 环境 下 ， 数 据 
规模 和 复杂 度 非常 迅速 的 增加 ， 按 需 扩展 系统 的 规模 是 非常 必要 的 ， 实 现存 储 系统 的 高 
可 扩展 性 首先 要 解决 元 数据 分 配 和 数据 迁移 这 两 个 技术 挑战 ;3) 存 储 层级 内 的 优化 技术 ， 
构建 存储 系统 时 , 通常 采用 多 层 不 同性 价 比 的 存储 器 件 来 组 成 层次 存储 , 对 大 数据 存储 ， 
在 保证 系统 性 能 的 前 提 下 ， 构 建 高 效 合理 的 存储 层次 ; 4) 针对 负载 的 存储 优化 技术 ， 传 
统 存储 模型 需要 支持 尽 可 能 多 的 应 用 ， 因 此 需要 考虑 通用 性 ， 而 大 数据 具有 大 规模 、 高 
动态 等 特性 ， 需 要 结合 大 数据 应 用 负载 对 文件 系统 进行 定制 和 深度 优化 ， 并 对 数据 存储 
和 大 数据 应 用 进行 耦合 ， 放 宽 POSIX 接口 ， 扩 展 分 布 式 文件 系统 功能 。 

数据 分 析 : 利用 数据 分 析 的 方法 、 模 型 、 工 具 对 数据 进行 分 析 ， 从 数据 中 发 现 知识 
并 加 以 利用 ， 进 而 指导 人 们 的 决策 ， 满 足 大 多 数 和 常见 的 分 析 需 求 。 大 数据 环境 下 ， 传 统 
的 数据 分 析 方 法 往往 无 能 为 力 ， 需 要 进行 深度 的 数据 分 析 和 深入 的 数据 挖掘 ， 以 满足 更 
高 级 别 的 数据 分 析 需 求 。 

大 数据 时 代 ， 不 同 领域 、 不 同 格 式 的 数据 从 生活 和 工作 的 各 个 领域 涌现 出 来 。 大 数 
据 往 往 含 有 噪声 ， 具 有 动态 异 构 性 。 如 果 采 用 传统 的 采样 技术 ， 尽 管 能 将 数据 规模 变 小 ， 
但 有 可 能 导致 信息 的 丢失 ， 这 是 得 不 偿 失 的 。 如 果 采 用 传统 的 分 析 方法 ， 那 就 很 难 从 数 
据 中 发 现 知识 并 获得 决策 指导 , 传统 分 析 方法 生产 的 简单 报表 无 法 满足 人 们 的 分 析 需 求 ， 
大 数据 下 的 数据 分 析 必 须 采 用 深度 分 析 , 即 人 们 不 仅 需要 通过 数据 了 解 现 在 发 生 了 什么 ， 
还 需要 利用 数据 对 即将 发 生 的 事件 进行 预测 ， 以 便于 在 行动 上 做 出 主动 的 准备 。 





10.5 大 数 
不 同 存储 方案 提供 商 针 对 大 数据 存储 有 不 同 的 产品 ， 本 节 先 介绍 互联 网 大 数据 解决 方案 
Hadoop”， 再 介绍 华为 针对 大 数据 存储 推出 的 0ceanStor 9000 产品 与 FusionStorage 产品 。 
10.5.1 互联 网 大 数据 解决 方案 


前 文 介绍 了 互联 网 公司 数据 主要 以 非 结构 化 数据 为 主 ， 针 对 非 结构 化 数据 为 主 的 互 
联网 大 数据 解决 方案 比较 有 代表 性 的 是 Hadoop。Hadoop 是 一 种 开源 的 针对 大 规模 数据 进行 
分 布 式 处 理 的 技术 框架 ， 在 处 理 非 结构 化 数据 上 有 着 性 能 和 成 本 方面 的 优势 。 
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图 10-8 为 Hadoop 的 组 成 图 ， 主 要 分 为 三 个 部 分 ， 分 别 是 : Hadoop 分 布 式 文件 系统 
(Hadoop Distributed File System，HDFS)、Hadoop 非 关系 型 数据 库 (Hadoop Database， 
HBase) 和 WMapReduce 分 布 式 并 行 处 理 架 构 。 


分 析 平台 


MapReduce 


Hbase 
-分 布 式 并 行 处 理 架构 - 非 关 系 型 数据 库 


HDFS- 分 布 式 文件 系统 





图 10-8 Hadoop 组 成 


HDFS 是 一 个 构建 于 廉价 计算 机 集群 之 上 的 分 布 式 文件 系统 , 采用 三 副本 元 余 方 式 对 
数据 块 进行 存储 ， 有 着 极 高 的 容错 特征 ， 适 用 于 大 规模 数据 信息 的 存储 。 三 副本 存储 方 
式 带 来 两 个 优势 : 一 方面 ， 它 能 保证 数据 的 可 靠 性 ， 从 而 降低 了 系统 对 底层 硬件 的 可 靠 
性 要 求 ， 即 Datanode 节点 可 以 是 低廉 的 硬件 ; 另 一 方面 ， 它 提供 了 对 数据 读 写 的 高 吞吐 
率 。 有 具体 地 ，HDFS 利用 Namenode 节点 对 所 有 的 数据 块 进行 复制 操作 ， 这 主要 是 为 了 实 
现 节点 故障 容错 ; 同时 ， 可 以 对 集群 中 的 Datanode 节点 进行 周期 性 的 心跳 信号 检测 ， 获 
得 相关 数据 块 的 状态 报告 。 当 Namenode 节点 顺利 收 到 某 Datanode 节点 的 心跳 信号 ， 证 
明 这 个 节点 的 状态 良好 ， 适 合用 于 存储 数据 信息 。 

HBase (Hadoop Database) 是非 关系 型 数据 库 的 一 种 ， 是 构建 在 HDFS 之 上 的 分 布 
式 、 面 向 列 的 存储 系统 。 它 具有 高 可 靠 、 高 性 能 、 面 向 列 和 可 伸缩 的 特性 ， 利 用 HBase 
技术 可 在 廉价 PC 上 搭建 起 大 规模 结构 化 存储 集群 。HBase 利用 Hadoop MapReduce 来 处 
理 HBase 中 的 海量 数据 ; 利用 Zookeeper 来 提供 失效 转移 服务 ; 利用 Pig 和 five 来 进行 
数据 统计 处 理 ， 利 用 Sqoop 来 完成 RDBMS 数据 导入 功能 ， 使 得 传统 数据 库 向 HBase 迁移 
变 得 非常 简单 。HBase 适合 存储 大 表 数 据 〈 表 的 规模 可 以 达到 数 十 亿 行 以 及 数 百 万 列 )， 
并 且 大 表 数 据 的 读 、 写 访问 可 以 达到 实时 级 别 。 

MapReduce 是 Google 提出 的 一 种 简化 并 行 计算 的 编程 模型 , 其 思想 是 将 大 规模 集群 
上 运行 的 并 行 计算 加 以 抽象 化 ,并 用 Map 和 Reduce 两 个 抽象 函数 加 以 表达 ,在 软件 框架 ， 
MapReduce 首先 对 任务 进行 分 解 ， 然 后 汇总 中 间 运 行 的 结果 ， 最 终 得 到 终极 结果 集 。 
MapReduce 的 工作 原理 主要 包括 以 下 具体 内 容 ，(1) 提交 MapReduce 作业 。 在 提交 作业 
之 后 ，runJob 方法 将 在 每 秒 轮 询 作 业 进 度 ， 显 示 作 业 的 完成 状况 ， 对 于 与 记录 不 符 的 作 
业 要 在 控制 台 加 以 显示 ， 对 于 成 功 的 作业 ， 则 显示 出 作业 计数 器 ; (2) MapReduce 作业 
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的 初始 化 。 当 JobTracker 接收 到 submitJob 方法 的 调用 之 后 , 由 作业 调度 器 对 其 进行 调 
度 ， 实 施 初始 化 ， 并 追踪 任务 实施 的 状态 ; (3) MapReduce 任务 的 分 配 。JobTracker 首 
先 要 选 定 任务 所 在 的 作业 ， 在 选取 好 作业 之 后 ，JobTracker 就 可 以 为 该 作业 分 配 一 个 确 
定 的 任务 。 


10.5.2 OceanStor 9000 解决 方案 


0ceanStor 9000 作为 大 数据 存储 产品 ， 有 具有 大 容量 、 高 性 能 和 易 扩 展 性 等 方面 的 突 
出 优势 。0ceanStor 9000 能 为 用 户 提 供 结构 化 数据 和 非 结 构 化 数据 共享 服务 ， 能 够 支持 
广电 媒体 、 卫 星 测 绘 、 基 因 测 序 、 能 源 勘 探 、 科研 教育 等 多 种 数据 业务 ， 适 用 于 高 性 能 
计算 、 数 据 中 心 、 互 联网 运营 等 领域 ” 

0ceanStor 9000 系统 架构 如 图 10-9 和 它 采 用 全 对 称 分 布 式 架 构 ， 支 持 3 一 288 
节点 弹性 无 终 扩 展 , 容量 和 性 能 随 节 点 增加 而 线性 增长 。 所 有 的 节点 都 统一 于 0ceanStor 
9000 硬件 平台 , 内 部 网 络 采用 10GE 以 太 网 或 者 40GE Infiniband 高 速 网 络 ,支持 TOE/RDMA 
技术 ， 因 此 0ceanStor 9000 可 以 在 保障 低 延 时 、 高 带宽 、 高 并 发 的 同时 表现 出 极 好 的 性 能 。 
为 了 匹配 不 同 的 应 用 场景 ，0ceanStor 9000 的 节点 分 为 高 OPS 节点 、 高 带宽 节点 和 大 容量 
节点 三 种 类 型 ， 用 户 可 以 根据 不 同 的 商业 性 能 和 容量 的 需求 ， 灵 活 配置 不 同 数量 的 节点 。 








图 10-9 0ceanStor 9000 系统 架构 


0ceanStor 9000 支持 多 种 接口 与 数据 类 型 ， 如 NAS 接口 NFS、CIFS 和 POSIX， 对 象 访问 
接口 REST 和 SOAP， 数 据 库 接 口 JDBC 和 0DBC， 备 份 归档 接口 YTL 和 0ST 等 。 应 用 这 一 特性 ， 
OceanStor 9000 解决 方案 可 以 胜任 核心 生产 数据 存储 、 商 业 数 据 存储 与 分 析 等 应 用 场景 。 

0ceanStor 9000 大 数据 存储 系统 包含 文件 存储 子 系统 WushanFS、 结 构 化 分 析 子 系 
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统 WushanSQL 和 非 结构 化 分 析 子 系统 FusionInsight Hadoop， 对 外 提供 针对 大 数据 优化 
的 存储 、 分 析 支 撑 能 力 。WushanFs 分 布 式 文 件 系统 将 三 个 传统 的 存储 体系 结构 层 〈 文 件 
系统 、 卷 管理 器 和 RAID) 组 合 为 一 个 统一 的 软件 层 ， 从 而 创建 一 个 跨越 存储 系统 中 所 有 
节点 的 单一 智能 文件 系统 ， 支 持 全 局 命名 空间 ， 支 持 动态 扩展 。WuashanSgL 分 布 式 数 据 库 
支持 海量 结构 化 、 非 结构 化 数据 快速 检索 ， 提 供 标准 SQL 接口 对 结构 化 数据 进行 直接 存 取 
和 复杂 关联 分 析 ， 同 时 支持 通过 标准 文件 接口 (NFS/CIFS) 存 入 非 结 构 化 、 半 结构 化 数据 。 
基于 企业 级 的 FusionInsight Hadoop 支持 Sqoop、MapReduce、HBase 和 Hive。 用 户 借助 
WushanSQL 和 FusionInsight Hadoop，0ceanStor 9000 能 够 提供 数据 分 析 和 查询 功能 。 


10.5.3 ”FusionStorage 解决 方案 

FusionStorage 是 一 款 支 持 大 规模 横向 扩展 的 软件 定义 存储 产品 。 它 通过 存储 系统 
软件 将 标准 X86 服务 器 的 本 地 存储 资源 组 织 起 来 ， 构 建 出 全 分 布 式 存储 池 ， 实 现 一 套 存 
储 系统 ， 向 上 层 应 用 提供 块 级 、 文 件 级 和 对 象 级 三 种 存储 服务 ， 满 足 结构 化 、 非 结构 化 
等 多 种 类 型 数据 存储 需求 ”。 FusionStorage 系统 架构 如 图 10-10 所 示 。 





块 存储 应 用 文件 存储 应 用 


兼容 Amazon S3 接 口 / 


SCSIISCSI NFS/CIFS/FTP OpenStack Swift 接口 


块 存储 服务 文件 仓储 服务 对 象 和 存储 服 务 


图 10-10 FusionStorage 架构 
FusionStorage 将 HDD、SSD 等 硬件 存储 介质 通过 分 布 式 技术 组 织 成 大 规模 存储 资源 
池 ， 为 上 层 应 用 和 客户 端 提供 工业 级 标准 接口 ， 实 现 一 套 系统 按 需 提供 块 、 文 件 和 对 象 
全 融合 存储 服务 能 为 。 用 户 只 需要 在 标准 X86 硬件 之 上 部 署 FusionStorage 软件 ， 即 可 
获得 业务 所 需 类 型 的 存储 服务 ， 而 无 需 提 前 采购 大 量 的 专用 存储 设备 ， 实 现存 储 服务 类 
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型 免 规 划 。 

FusionStorage 提供 SCST、 iSCSI 块 存储 接口 , 支持 分 布 式 块 存储 服务 。 FusionStorage 
通过 存储 虚拟 化 技术 创建 基于 本 地 服务 器 的 SAN 存储 ， 支 持 广泛 的 虚拟 化 平台 及 数据 库 应 
用 ,提供 高 性 能 与 高 扩展 能 力 ， 满 足 云 资源 池 、 桌 面 云 、 开 发 测试 云 及 数据 库 等 场景 的 SAN 

FusionStorage 提供 NFS、CIFS、FTP、HDFS 等 文件 存储 接口 ， 支 持 分 布 式 文件 存储 
服务 。FusionStorage 以 卓越 性 能 、 大 规模 横向 扩展 能 力 和 超大 单一 文件 系统 为 用 户 提 
供 非 结 构 化 数据 共享 存储 资源 ， 应 用 于 视频 /音频 海量 存储 、 大 数据 应 用 等 多 业务 场景 。 

FusionStorage 提供 兼容 Amazon S3 接口 和 0penStack Swift 的 对 象 存储 接口 ， 支 
持 分 布 式 对 象 存储 服务 ， 支 持 融 入 主流 云 计算 生态 环境 ， 满 足 云 备 份 、 云 归档 及 公有 云 
存储 服务 运营 场景 需求 。 

FusionStorage 提供 统一 的 系统 管理 平台 ， 包 含 数据 服务 子 系统 (DSS) 及 运 维 管理 
子 系统 (0MS) 两 大 部 分 。DSS 提供 精细 的 租户 管理 、 存 储 资源 管理 和 自动 化 资源 发 放 功 
能 。0OMS 提供 告警 、 拓 扑 、 性 能 报表 等 丰富 的 硬件 平台 监控 与 管理 功能 。FusionStorage 
通过 提供 自动 化 、 完 善 的 数据 服务 与 运 维 管理 功能 ， 可 显著 降低 数据 中 心 运 维 人 员 的 维 
护 工作 难度 ， 并 支撑 业务 快速 上 线 。 

FusionStorage 技术 特点 概括 如 下 。 

大 规模 线性 扩展 和 弹性 : FusionStorage 采用 分 布 式 DHT 架构 , 将 所 有 元 数据 按 规 则 分 
布 在 各 个 存储 节点 , 不 存在 跨 节点 的 元 数据 访问 , 彻底 解决 了 元 数据 负载 频繁 倾斜 导致 的 系 
统 性 能 瓶颈 问题 。FusionStorage 采用 了 独特 的 数据 分 块 切片 技术 及 DHT Hash 的 数据 路 由 算 
法 ， 可 将 卷 的 数据 均匀 地 分 散 到 较 大 的 资源 池 范 围 内 ， 使 得 每 个 硬件 资源 的 负载 相对 均衡 。 

高 性 能 ，FusionStorage 支持 分 布 式 的 SSD cache 技术 ， 配 合 大 容量 的 SATA 盘 做 主 
存 ， 使 得 系统 的 性 能 可 以 具备 SSD 的 性 能 和 SATA 的 容量 。 

高 可 靠 性 : FusionStorage 对 有 效 数 据 分 片 进行 元 余 保 护 ， 在 和 硬盘、 服务 器 故障 的 时 
候 ， 能 够 并 行 重建 有 效 数据 ，1TB 硬盘 的 重建 时 间 小 于 30' 分 钟 ， 大 大 增强 系统 的 可 靠 性 。 

简化 运 维 管理 FusionStorage 的 数据 元 余 保 护 技术 ， 按 照 数 据 切 片 进行 有 效 数 据 
保护 ， 重 建 时 只 要 资源 池 范 围 内 有 剩余 可 用 容量 即 可 进行 故障 数据 恢复 。 与 传统 SAN 需要 
及 时 更 换 故 障 盘 和 热 备 盘 不 同 ， 这 种 方式 在 硬盘 故障 的 时 候 ， 无需 及 时 更 换 硬盘 ， 只 需要 
系统 预 留 足 够 的 剩余 可 用 空间 ， 系 统 就 可 以 自动 地 在 其 他 地 方 将 故障 的 数据 重建 出 来 。 

FusionStorage 的 主要 应 用 场景 分 为 两 大 类 。 

一 类 是 在 企业 关键 IT 基础 设施 中 ,FusionStorage 通过 Infiniband 进行 服务 器 互联 、 
SSD cache 等 关键 技术 ， 提 高 了 存储 系统 的 性 能 和 可 靠 性 ， 保 留 了 分 布 式 存储 的 高 扩展 基 
因 ， 支 持 企业 关键 数据 库 、 关 键 ERP 等 应 用 的 使 用 ， 解 决 关 键 应 用 的 大 数据 量 需求 。 

男 一 类 是 在 大 规模 云 计 算数 据 中 心中 ， 将 通用 X86 存储 服务 器 进行 资源 池 化 ， 建 立 
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大 规模 块 存储 资源 池 ， 提 供 标准 的 块 存储 数据 访问 接口 (SCSI 和 iSCSI 等 )。 
FusionStorage 支持 各 种 虚拟 化 Hypervisor 平台 和 各 种 业务 应 用 (如 SQL、Web 等 行业 
应 用 ); 可 以 和 各 种 云 平台 和 集成， 如 华为 FusionSphere、VMware、 开 源 0penstack 等 ， 
按 需 分 配 存 储 资源 。 





本 章 首 先 介绍 了 不 同 组 织 或 机 构 对 大 数据 的 定义 ， 然后 阐述 了 大 数据 的 来 源 、 内 容 
类 型 、 大 数据 的 组 成 及 价值 ; 接着 概述 了 大 数据 的 4Y 特性 及 处 理 流程 ; 最 后 描述 了 几 种 
常见 的 互联 网 大 数据 解决 方案 ， 如 ，Hadoop、0ceanStor 9000、FusionStorage。 通 过 阅 
读本 章 ， 希 望 读者 对 如 下 几 个 概念 有 所 认识 。 

(1) 大 数据 的 定义 ; 

(2) 大 数据 的 内 容 类 型 ; 

(3) 大 数据 的 组 成 、 价 值 ; 

(4) 大 数据 特征 。 





一 、 选 择 题 

1. 大 数据 有 哪些 特性 ? (  ) 

A. Volume B. Variety C. Value D. Velocity 
2. 大 数据 解决 方案 主要 用 于 存储 哪 种 类 型 的 数据 ? (  ) 


A. 结构 化 数据 B， 非 结构 化 数据 
C. 结构 化 数据 和 非 结构 化 数据 D. 以 上 都 不 是 
二 、 简 答题 


1， 结合 大 数据 的 作用 及 处 理 流 程 ， 列 举 生 活 中 的 大 数据 实际 应 用 场景 。 


2. 大 数据 与 传统 数据 的 主要 区 别 是 什么 ? 
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11.1 备份 简介 
11.2” 容 灾 简介 
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随 着 IT 技术 的 广泛 应 用 ， 各 类 应 用 系统 对 存储 提出 了 安全 性 需求 和 业务 连续 性 需 
求 。 为 了 增强 数据 安全 性 ， 企 业 需 要 使 用 数据 备份 技术 。 为 了 保障 业务 连续 性 和 系统 可 
用 性 ， 企 业 需要 使 用 容 灾 技 术 。 本 章 主 要 介绍 容 灾 和 备份 的 技术 基础 。 






he。 二 本 罕 交 在 从 基本 梳 ; 
了》。 热 悉 不 同 备份 介质 的 优势 和 劣势 
C9。 掌握 备份 系统 的 组 成 、 备 份 组 网 结构 及 备份 类 型 

_，。 热 起 容 灾 的 分 类 及 容 灾 采 统 衡量 指标 ; 
。 掌握 容 灾 复制 技术 的 原理 ; 
。 了解 容 灾 备 份 的 相关 解决 方案 . 





随 着 信息 技术 的 飞速 发 展 与 数据 业务 的 快速 增长 ， 存 储 系统 在 企业 信息 系统 中 的 位 
置 显得 越 来 越 重 要 ， 企 业 的 业务 越 来 越 依赖 于 数据 信息 。 集 中 式 存储 方案 有 助 于 解决 数 
据 管理 问题 ， 分 布 式 存储 方案 则 让 数据 访问 变 得 更 加 容易 。 不 管 是 分 布 式 存储 还 是 集中 
式 存储 ， 企 业 信息 系统 对 存储 系统 的 安全 性 、 可 靠 性 和 存储 数据 的 完整 性 都 有 极 高 的 要 
求 。 存 储 系统 的 可 靠 性 很 大 程度 上 决定 了 应 用 系统 工作 的 稳定 性 和 应 用 业务 的 持续 性 ， 
而 数据 的 完整 性 往往 决定 了 应 用 系统 能 否 正常 工作 。 
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随 着 IT 技术 的 不 断 发 展 ， 各 种 应 用 系统 不 断 上 线 ， 不 同类 型 数据 的 数据 量 增长 也 
越 来 越 快 。 而 数据 丢失 对 于 企业 来 说 是 非常 可 怕 的 ， 各 种 应 用 系统 会 因为 数据 信息 的 丢 
失 而 无 法 正常 运行 ， 可 能 会 导致 业务 的 中 断 或 停 运 ， 甚 至 会 损失 严重 导致 公司 倒闭 。 
由 于 操作 失误 、 病 毒 、 人 为 破坏 、 软 件 缺 陷 、 系 统 升级 等 因素 导致 数据 逻辑 错误 ， 进 而 
导致 数据 丢失 的 情况 屡见不鲜 ， 因 此 ， 增 强 数据 的 安全 性 对 企业 而 言 是 至 关 重 要 的 ， 于 
是 出 现 了 各 种 数据 保护 技术 。 一 个 典型 案例 是 ， 为 了 保证 关键 数据 不 被 破坏 或 丢失 ， 企 
业 在 存储 系统 中 引入 了 数据 备份 技术 。 


11.1.1 备份 概念 及 拓扑 结构 


在 信息 数据 管理 领域 ， 备 份 通常 指 在 数据 中 心 内 ， 将 文件 系统 或 数据 库 系 统 中 全 部 
或 部 分 数据 集合 从 应 用 主机 的 磁盘 或 存储 阵列 复制 到 其 他 存储 介质 的 过 程 ， 目 的 在 于 防 
止 因 操 作 失 误 、 病 毒 、 人 为 破坏 、 软 件 缺 陷 、 系 统 升 级 、 软 件 故障 等 因素 造成 数据 的 永 
久 性 丢失 。 生 产 过 程 中 ， 一 旦 出 现 故 障 或 错误 操作 而 导致 数据 失效 时 ， 可 以 方便 而 及 时 
地 利用 备份 数据 来 恢复 失效 数据 , 保证 系统 正常 运作 。 一 个 完善 的 数据 备份 与 恢复 方案 ， 
可 以 用 于 备份 、 归 档 并 恢复 各 类 计算 环境 中 的 数据 , 这 些 计算 环境 可 以 是 大 型 数据 中 心 、 
远程 存储 集群 组 ， 也 可 以 是 台式 机 、 笔 记 本 电脑 等 。 一 个 完整 的 备份 系统 通常 由 备份 服 
务 器 、 备 份 介质 、 备 份 软件 、 备 份 客户 端 和 备份 网 络 构成 ， 如 图 11-1 所 示 。 





图 11-1 备份 系统 组 成 


备份 系统 中 备份 软件 负责 备份 策略 管理 和 备份 作业 监控 ， 读 取 备 份 客户 端的 数据 并 
把 数据 写 入 到 备份 介质 中 。 备 份 服务 器 主要 为 备份 软件 提供 运行 的 环境 ， 备 份 介质 作为 
保存 数据 的 载体 ， 用 于 存放 备份 数据 ; 备份 客户 端 作为 需要 备份 数据 的 业务 主机 ， 一 般 
安装 有 备份 软件 客户 端 代理 程序 (Agent )， 负 责 提 供 要 备份 的 数据 ; 备份 网 络 为 备份 数 
据 流 在 备份 客户 端 与 备份 服务 器 之 间 的 传输 提供 数据 通道 ， 可 以 是 前 端的 业务 网 络 ， 也 
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可 以 包括 后 端的 存储 网 络 。 

1. 备份 服务 器 

备份 服务 器 是 备份 软件 的 运行 平台 ， 是 指 安装 了 备份 软件 的 应 用 服务 器 ， 包 括 备份 
管理 服务 器 和 介质 服务 器 ; 此 外 ， 备 份 服务 器 为 备份 策略 的 执行 提供 服务 。 在 某 些 备份 
架构 中 ， 备 份 服务 器 除了 提供 备份 系统 中 各 角色 之 间 通 信 交 互 的 备份 指令 流 ， 也 会 接收 
应 用 发 送 过 来 的 备份 数据 流 并 将 这 些 数据 送 往 备份 介质 上 ， 进 行 统 一 、 集 中 备份 ， 在 备 
份 架构 中 起 着 中 枢 的 作用 。 

备份 管理 服务 器 也 称 主 服务 器 ， 是 全 网 的 管理 中 心 ， 其 安装 有 备份 软件 负责 管理 的 
软件 模块 。 备 份 管理 服务 器 负责 整个 备份 流程 的 调度 工作 ， 指 挥 整个 数据 备份 系统 中 各 
个 角色 有 条 不 亲 地 动作 ， 并 对 它们 之 间 的 控制 通路 进行 管理 ， 监 控 数 据 备 份 与 恢复 的 全 
过 程 。 此 外 ， 备 份 管理 服务 器 还 需 制 定 全 网 的 备份 策略 ， 决 定 备份 系统 工作 的 规则 (如 
什么 时 候 开 始 备份 、 备 份 哪 些 业 务 主机 、 备 份 业务 主机 上 的 什么 内 容 、 数 据 备份 到 什么 
地 方 、 备 份 数据 保 留 多 长 时 间 等 )。 一 台 备 份 管理 服务 器 能 够 管理 多 台 介 质 服务 器 ， 介 质 
服务 器 和 业务 主机 通过 前 端 业务 网 络 进行 交互 ， 实 现 并 发 备份 。 

介质 服务 器 是 备份 客户 端 和 备份 介质 的 中 间 件 ， 其 安装 有 备份 软件 的 介质 服务 器 软 
件 模块 ， 负 责 响 应 管理 服务 器 的 调度 通知 并 管理 和 操纵 备份 介质 。 介 质 服务 器 通过 前 端 
业务 网 络 与 备份 管理 服务 器 、 备 份 客户 端 进行 交互 ， 通 过 前 端 业务 网 络 或 后 端 存储 网 络 ， 
与 备份 客户 端 进行 备份 数据 的 传输 。 由 于 某 些 备份 介质 (如 SCSI 磁带 机 ) 同一 时 刻 只 能 
连接 一 台 主 机 , 这 台 主 机 以 外 的 其 他 主机 无 法 掌管 和 使 用 它 的 存储 资源 。 以 SCSI 磁带 机 
为 例 ， 它 只 提供 一 个 与 主机 交互 的 接口 ， 不 支持 多 台 主 机 掌管 和 共享 磁带 资源 。 介 质 服 
务 器 存在 的 意义 在 于 其 充当 备份 介质 的 掌管 者 ， 借 助 于 网 络 ， 实 现 多 台 主 机 对 备份 介质 
的 共享 。 作 为 备份 数据 的 中 转 站 ， 介 质 服务 器 可 以 通过 网 络 接收 多 个 不 同 备份 客户 端 所 
需 备 份 的 数据 ， 并 操纵 备份 介质 将 这 些 数据 保存 下 来 。 简 言 之 ， 利 用 介质 服务 器 ， 可 以 
实现 不 同 地 理 位 置 上 的 多 个 备份 客户 端 对 一 份 备份 介质 的 共享 。 

2. 备份 介质 ; 

备份 介质 是 备份 数据 存储 的 媒介 ， 是 备份 数据 的 载体 ， 其 质量 直接 关系 到 备份 工作 
的 效率 和 备份 数据 的 安全 性 。 如 图 11-2 所 示 , 常用 的 备份 介质 有 磁盘 阵列 、 物理 磁带 库 、 
虚拟 磁带 库 、 光 盘 塔 /光盘 库 等 。 





磁盘 阵列 磁盘 库 虚拟 磁带 库 光盘 塔 /光盘 库 
图 11-2 备份 介质 
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磁极 阵列 以 机 械 硬 盘 或 固态 硬盘 作为 备份 数据 的 存储 载体 。 磁 盘 阵 列 作为 备份 介质 
的 一 大 优势 在 于 数据 备份 和 恢复 性 能 高 。 一 方面 ， 机 械 硬 盘 或 固态 硬盘 可 以 迅速 完成 备 
份 任务 ， 释 放 备份 操 作 所 占用 资源 ， 这 对 备份 数据 量 庞大 而 备份 窗口 有 限 的 应 用 场景 非 
常 有 利 ; 男 一 方面 , 其 恢复 性 能 和 备份 性 能 基本 相等 ， 当 业务 运作 过 程 中 出 现 数据 丢失 ， 
可 以 在 很 短 时 间 内 恢复 出 丢失 数据 ， 减 少 业 务 中 断 带 来 的 损失 。 对 于 需要 大 量 历史 数据 
的 新 兴业 务 ， 如 数据 挖掘 、 在 线 分 析 等 ， 高 速 数 据 恢复 更 具有 应 用 意义 。 男 外 ， 由 于 磁 
盘 是 全 密闭 的 电子 设备 ， 工 作 过 程 中 不 需要 人 工 干 预 ， 从 而 ， 磁 盘 阵列 的 故障 率 远 远 低 
于 磁带 设备 ， 不 仅 极 大 地 提高 系统 备份 和 恢复 的 可 靠 性 ， 而 且 降 低 了 维护 成 本 ,减少 了 
维护 人 员 的 实际 工作 量 。 当 然 ， 以 磁盘 阵列 作为 备份 介质 ， 也 存在 两 点 不 足 : 一 是 磁盘 
单位 容量 价格 比 磁带 高 ， 以 磁盘 为 备份 介质 所 需 投 入 的 成 本 自然 比较 高 ， 二 是 磁盘 通常 
要 采用 RAID 技术 来 组 成 磁盘 阵列 来 提高 数据 的 读 写 性 能 和 可 靠 性 , 而 磁盘 一 旦 离开 了 它 
所 属 的 RAID 组 ， 存 放 其 上 的 数据 就 没有 意义 ， 因 此 磁盘 阵列 不 能 离线 保存 数据 。 

人 厂 带 库 是 比较 常见 的 基于 磁带 的 备份 系统 ， 由 驱动 器 、 磁 带 槽 、 机 械 手 臂 组 成 ， 机 
械 手 臂 可 以 按照 预定 程序 自动 拆卸 或 装载 磁带 ， 实 现 自动 备份 和 恢复 功能 。 一 个 矿 带 库 
可 以 支持 多 个 驱动 器 并 行 工 作 。 多 个 驱动 器 可 以 专门 为 一 个 应 用 服务 器 进行 备份 ， 也 可 
以 为 多 个 应 用 服务 器 执行 备份 。 采 用 磁带 库 作 为 备份 介质 的 优势 很 多 ， 首 先 ， 磁 带 库 可 
实现 数据 存储 载体 和 读 写 装置 的 分 离 ， 可 实现 数据 的 离线 保存 ， 而 不 像 磁盘 一 样 离开 了 
磁盘 控制 器 系统 便 无 法 使 用 ， 其 次 ， 磁 带 库容 量 扩展 性 好 ， 通 过 添加 磁带 即 可 达到 扩容 
的 目的 ， 理 论 上 讲 ， 其 存储 容量 可 以 无 限 大 。 此 外 ， 和 磁带 的 单位 存储 成 本 较 低 ， 应 用 较 
为 广泛 。 由 于 其 固有 特性 ， 磁 带 库 也 存在 它 三 个 不 足 : 1) 性 能 。 磁 带 的 读 写 是 顺序 进行 
的 ,无 法 像 硬盘 一 样 进行 随机 读 写 ， 使 得 读 写 性 能 较 差 ， 导 致 数据 备份 和 恢复 性 能 较 低 ; 
2) 可 靠 性 。 物理 磁带 比较 容易 受 环境 影响 而 失效 ,磁带 库 的 整体 可 靠 性 会 随 着 磁带 使 用 
次 数 的 增多 而 不 断 下 降 ; 3) 故障 率 。 磁带 库 是 一 个 由 很 多 的 精密 机 械 元 器 件 组 成 的 更 大 
精密 仪器 系统 ， 任 何 零 部 件 的 磨损 都 有 可 能 造成 整个 磁带 库 的 宕 机 ， 而 机 械 手 臂 因 频 繁 
的 机 械 运动 容易 产生 故障 ， 这 种 机 械 故 障 往往 无 法 通过 规划 备份 策略 来 避免 。 

虚拟 磁带 库 (Virtual Tape Library，VTL) 与 物理 磁带 库 不 同 ， 其 采用 物理 磁盘 
作为 存储 介质 ， 通 过 虚拟 化 引擎 来 模拟 机 械 手 臂 、 磁 带 驱动 器 以 及 磁带 插 模 。VTL 兼备 
了 物理 磁带 库 和 磁盘 阵列 的 优势 ， 首 先 ， 由 于 没有 机 械 零 部 件 ，VTL 的 可 靠 性 和 可 维护 
性 相 比 于 物理 磁带 库 有 了 很 大 的 提高 ， 其 次 ，VTL 采用 物理 磁盘 作为 存储 介质 ， 具 有 较 
高 访问 性 能 ， 而 且 可 以 采取 压缩 、 重 复数 据 删 除 等 技术 进行 备份 ， 其 读 写 性 能 远 远 高 于 
物理 磁带 库 ， 与 磁盘 阵列 不 相 上 下 ; 再 者 ， 虚 拟 磁带 库 采 用 了 虚拟 化 引擎 ， 从 服务 器 的 
角度 ， 它 是 一 个 磁带 库 ， 操 作 系统 只 有 通过 特定 的 备份 软件 才能 够 对 其 进行 读 写 操作 ， 
避免 了 数据 被 误 删除 或 被 病毒 感染 等 问题 ; 此 外 ，VTL 可 以 融入 到 现 有 磁带 备份 环境 中 ， 
和 磁带 产品 配合 使 用 ， 构 成 一 个 集 磁带 和 磁盘 两 种 技术 优势 的 备份 解决 方案 。 不 足 之 处 
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在 于 ， 由 于 VTL 和 磁盘 阵列 都 是 采用 磁盘 作为 存储 介质 ， 都 存在 单位 存储 成 本 高 、 整 体 
部 署 成 本 高 问题 ， 另外，VTL 不 能 像 物 理 磁 带 库 那 样 通过 增加 磁带 扩充 容量 ， 其 容量 扩 
展 性 能 较 差 。 

光盘 库 是 一 种 带 有 自动 换 盘 机 构 〈 机 械 手 臂 ) 的 光盘 网 络 共 享 设 备 ， 由 放置 光盘 
的 光盘 架 、 自 动 换 盘 机 构 和 驱动 器 三 部 分 组 成 。 光 盘 库 的 优势 在 于 光驱 、 光 盘 的 价格 
较 低 ， 而 且 光 盘 介质 保存 数据 的 时 间 长 ， 对 保存 环境 要 求 较 低 。 光 盘 库 的 劣势 在 于 
其 读 写 速度 慢 、 容 量 小 、 探 写 次 数 受 限 等 ， 同 时 ， 一 个 光盘 库 中 光驱 数量 有 限 ， 只 
能 支持 少数 用 户 并 发 备份 数据 。 光 盘 库 非常 适合 于 大 容量 数据 信息 的 存储 ， 尤 其 适 
合 于 各 种 多 媒体 信息 的 存储 ， 比 如 ， 银 行 的 票据 影像 存储 、 保 险 机 构 的 资料 存储 ， 
以 及 计算 机 软件 、 电 子 图 书 、 影 视 节 目 、 教 育 材料 的 出 版 发 行 。 一 些 大 型 企业 也 将 
自己 的 专用 多 媒体 信息 (如 企业 宣传 片 、 产 品 宣传 片 、 企 业 介 绍 YCD、 广 告 VCD 等 ) 
和 一 些 重 要 的 技术 文档 和 资料 保存 在 光盘 库 中 。 

3. 备份 软件 

备份 软件 是 备份 系统 的 核心 ， 主 要 功能 是 管理 备份 策略 、 监 控 备 份 作业 、 分 配备 份 
介质 。 除 了 给 备份 系统 制定 具体 的 工作 规则 进行 数据 的 备份 或 恢复 操作 ， 备 份 软 件 还 对 
备份 介质 及 其 上 的 生产 数据 副本 进行 管理 ， 以 实现 对 应 用 数据 、 应 用 程序 或 应 用 系统 的 
全 面 保护 。 除 了 上 述 主 要 功能 ， 一 些 备份 软件 还 具备 更 多 的 扩展 功能 。 

备份 软件 主要 由 管理 服务 器 软件 模块 、 介 质 服 务 器 软件 模块 和 客户 端 代理 软 件 模块 
三 个 模块 组 成 ， 分 述 如 下 : 1) 管理 服务 器 软件 模块 安装 在 备份 管理 服务 器 上 ， 负 责 管理 
和 维护 客户 端 、 介 质 代 理 、 备 份 设 备 的 配置 信息 和 整个 备份 系统 的 备份 策略 ， 并 为 用 户 
提供 可 视 化 的 管理 配置 界面 。 在 数据 备份 过 程 中 ， 管 理 服务 器 软件 模块 按照 备份 策略 统 
一 调度 备份 系统 的 各 个 软件 模块 ， 提 供 备份 任务 ， 监 控 备 份 作业 ; 在 数据 恢复 过 程 中 ， 
管理 服务 器 软件 模块 根据 恢复 策略 调配 各 个 软件 模块 ， 监 控 恢 复 作 业 的 执行 情况 ; 2) 介 
质 代 理 服 务 器 软件 模块 一 般 安 装 在 掌管 备份 设备 的 介质 服务 器 上 ， 负 责 与 管理 服务 器 软 
件 模块 、 客 户 端 代理 软件 模块 交互 ， 并 管理 备份 介质 和 生成 数据 副本 : 3) 客户 端 代理 软 
件 模块 一 般 安 装 在 业务 服务 器 上 ， 负 责 与 管理 服务 器 软件 模块 、 介 质 服务 器 软件 模块 通 
信 ， 为 介质 服务 器 提供 需要 备份 的 数据 。 

部 署 备份 软件 的 三 个 软件 模块 时 ， 需 要 考虑 不 同 的 应 用 场景 。 介 质 服务 器 软件 模块 
可 以 单独 安装 在 一 个 物理 服务 器 上 ， 也 可 以 和 管理 服务 器 软件 模块 装 在 同一 个 物理 服务 
器 上 。 介 质 服务 器 软件 模块 有 时 和 客户 端 代 理 软件 模块 一 起 装 在 生产 主机 上 。 使 用 备份 
软件 可 以 使 得 备份 系统 能 够 在 灾难 来 临 之 前 做 好 充分 的 准备 ， 轻 松 地 恢复 由 设备 故障 、 
病毒 攻击 或 意外 丢失 文件 等 情况 引起 的 丢失 数据 。 接 下 来 ， 介 绍 两 种 典型 备份 软件 ， 如 
Symantec 公司 的 NetBackup 软件 呈 和 CommVault 公司 的 Simpana 软件 。 
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Symantec 的 NetBackup 备份 软件 的 架构 如 图 11-3 所 示 ， 主 要 由 管理 服务 器 软件 模 
块 (Master Server)、 介 质 服 务 器 软件 模块 〈Media Server) 和 客户 端 代 理 软件 模块 
(Client) 构成 。 


管理 服务 器 管理 终端 





图 11-3 NetBackup 备份 软件 架构 


在 NetBackup 备份 平台 上 ， 备 份 管理 服务 器 上 安装 有 备份 软件 的 Master Server 软 
件 模 块 ， 管 理 终端 〈Management Console) 提供 可 视 化 操作 界面 用 于 管理 备份 软件 。 介 
质 服务 器 安装 有 Media Server 软件 模块 。 客 户 端 / 代 理 端 指 的 是 安装 了 备份 软件 客户 端 
代理 软件 模块 的 业务 主机 。 图 11-3 中 显示 的 是 一 个 完整 的 备份 系统 , 包括 一 台 备 份 管理 
服务 器 、 两 台 介 质 服务 器 、 两 台 备 份 存储 设备 和 六 台 业 务 主机 。 假 设 某 一 时 刻 ， 备 份 系 
统 需要 协同 完成 一 个 备份 任务 ， 其 工作 流程 大 致 如 下 。 

备份 管理 服务 器 发 起 备份 任务 ， 如 “介质 服务 器 A 备份 客户 端 1 上 C 盘 的 数据 呈 

介质 服务 器 A 收 到 任务 后 , 检查 备份 介质 ( 即 备 份 存储 设备 ) 是 否 准备 好 存储 空间 ， 
车 为 是 ， 则 向 客户 端 1 发 起 就 位 通知 请 求 传输 备份 数据 ; 

客户 端 1 收 到 就 位 信息 ， 通 过 前 端 业务 网 络 或 后 端 存储 网 络 将 所 需 备 份 的 数据 发 送 
给 介质 服务 器 A; 

介质 服务 器 A 将 接收 到 的 数据 写 入 备份 介质 中 ， 并 向 管理 服务 器 返回 备份 成 功 信息 
和 数据 索引 信息 ， 如 果 备 份 失败 则 返回 备份 失败 信息 。 

数据 索引 信息 是 数据 备份 平台 的 重要 组 成 部 分 。 众 所 周知 ， 一 个 数据 对 象 一 般 是 指 
一 个 文件 、 一 封 邮 件 或 一 个 文档 ， 而 无 论 数 据 备份 还 是 归档 ， 都 会 产生 数据 索引 ， 记 录 
着 对 象 名 、 对 象 大 小 、 存 放 地 址 、 保 留 时 长 等 信息 。 在 执行 数据 恢复 时 ， 备 份 软件 需要 
依赖 索引 信息 才能 准确 快速 定位 数据 对 象 。NetBackup 采用 传统 的 集中 式 索引 管理 方式 ， 
将 所 有 数据 索引 信息 存放 在 备份 管理 服务 器 上 , 实现 起 来 非常 简单 并 且 方 便 管 理 。 然而， 
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处 于 当今 这 个 大 数据 时 代 ， 海 量 数据 所 对 应 的 索引 信息 也 将 会 是 巨大 的 ， 从 而 集中 式 索 
引 管 理 方式 面临 着 诸多 挑战 ， 一 是 备份 管理 服务 器 将 会 成 为 整个 备份 系统 的 性 能 瓶颈 ; 
二 是 由 于 大 量 索 引信 息 也 需要 备份 ， 生 产 系统 的 备份 时 间 也 随 之 延长 ， 业 务 运作 可 能 会 
受到 影响 ， 三 是 假设 索引 信息 是 集中 式 存放 ， 一 旦 丢失 或 损坏 ， 重 建 耗 时 非常 长 ， 备 份 
系统 将 无 法 正常 执行 备份 或 恢复 作业 。 

CommVault 的 Simpana 备份 软件 架构 主要 由 管理 服务 器 软件 模块 (CommServe，CS)、 
介质 代理 软件 模块 (MediaAgent，MA)、 客 户 端 代理 软件 横 块 〈iDataAgent，iDA) 构成 ， 
分 别 部 署 在 一 个 备份 域 中 的 备份 管理 节点 、 备 份 业务 节点 和 备份 客户 端 上 ， 如 图 11-4 
所 示 。 






备份 业务 节点 


/ 
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与 NetBackup 平台 相似 , Simpana 平台 将 备份 软件 的 CS 软件 模块 安装 在 备份 管理 服 
务 器 (备份 管理 节点 ) 上 ， 并 提供 全 网 的 管理 控制 台 ， 负 责 安全 管理 、 工 作 流 管理 、 策 
略 管理 等 。 介 质 服务 器 〈 备 份 业务 节点 ) 安装 有 MA 软件 模块 ， 人 负责 管理 备份 介质 ， 一 个 
备份 域 能 够 包含 一 个 或 者 多 个 MA 软件 模块 ， 利 用 多 个 MA 可 以 实现 负载 均衡 、 故 障 切 换 
和 并 行 去 重 操作 〈 重 复数 据 删 除 技 术 请 参看 11. 1.2 小 节 )。 备 份 客户 端 安装 一 个 或 者 多 
个 iDA 软件 模块 , 利用 iDA 软件 模块 通过 网 络 与 CS、MA 等 模块 进行 通信 交互 或 传输 备份 
数据 。Simpana 平台 下 ， 备 份 介质 也 称 为 介质 库 〈Library)， 主 要 由 磁盘 介质 设备 和 磁 
带 介 质 设 备 组 成 。 备 份 任 务 被 触发 后 ， 备 份 系统 CS 的 控制 下 ， 由 iDA 模块 负责 从 客户 端 
将 数据 读 出 并 传送 至 MA， 最 后 由 MA 将 备份 数据 写 入 具体 的 备份 介质 中 。 

Simpana 与 NetBackup 二 者 的 最 大 区 别 在 于 数据 索引 管理 方式 ，NetBackup 采用 集 
中 式 索引 方式 , 而 Simpana 采用 分 布 式 索 引 方式 。 分 布 式 索 引 中 索引 信息 分 为 两 个 层级 ， 
一 级 索引 主要 记录 备份 作业 完成 情况 以 及 备份 数据 的 大 臻 位置， 索引 数 据 量 很 少 ， 存 放 
于 备份 管理 服务 器 上 ; 二 级 索引 用 来 记录 每 个 数据 对 象 的 信息 和 上 有 具体 存放 位 置 ， 索 引信 


图 11-4 Simpana 备份 软件 架构 
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息 量 较 大 ， 与 备份 数据 一 起 存放 于 备份 介质 上 ， 由 介质 服务 器 管理 。 恢 复数 据 时 ， 系 统 
根据 一 级 索引 信息 确定 所 需 恢复 数据 的 副本 是 否 存 在 ， 并 定位 管理 该 数据 副本 的 MA，MA 
再 根据 二 级 索引 信息 将 数据 从 备份 介质 中 取出 并 返回 给 客户 端 。 分 布 式 索引 技术 能 有 效 
地 避免 集中 式 索引 中 存在 的 性 能 瓶颈 问题 ， 使 得 Simpana 备份 平台 能 满足 大 数据 时 代 海 
量 数据 管理 的 需求 。 

4. 备份 客户 端 

备份 客户 端 一 般 为 需要 备份 的 业务 主机 ， 在 业务 主机 上 安装 备份 软件 客户 端 代理 模 
块 。 备 份 客户 端 利用 备份 代理 模块 通过 网 络 与 管理 服务 器 、 介 质 服务 器 通信 交互 或 传输 
备份 数据 。 每 个 备份 客户 端 上 可 安装 一 个 或 多 个 代理 模块 ， 通 常情 况 下 ， 文 件 系 统 、 数 
据 库 和 应 用 系统 分 别 有 不 同 的 代理 。 

5. 备份 网 络 

备份 网 络 为 备份 控制 流 、 备 份 数据 流 在 备份 客户 端 与 备份 服务 器 之 间 传 输 的 数据 通 
道 ， 其 可 以 是 TCP/IP 网 络 ， 也 可 以 是 FC 网 络 ， 甚 至 可 以 两 者 兼 有 。 本 小 节 分 别 对 基于 
局 域 网 的 LAN-Base 组 网 结构 和 基于 SAN 的 LAN-Free 组 网 结构 加 以 阐述 。 

LAN-Base 是 一 种 基于 前 端 业务 网 络 的 拓扑 结构 ， 即 数据 备份 和 恢复 过 程 中 ， 数 据 流 
和 控制 流 的 传输 都 是 以 业务 网 为 数据 通道 的 。 这 是 一 种 占用 业务 网 络 资源 的 备份 模式 ， 
如 图 11-5 所 示 ， 一 般 用 于 小 型 办 公 环 境 。 
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命令 流向 到 数据 备份 存储 设备 


图 11-5 LAN-Ba 备份 拓扑 


在 LAN-Base 备份 系统 中 ， 备 份 管理 软件 模块 和 介质 代理 软件 模块 安装 在 同一 个 服 
务 器 〈 备 份 服务 器 ) 上 ， 两 个 客户 端 代理 模块 分 别 安装 在 两 台 应 用 服务 器 上 。 执 行 备 份 
任务 时 ， 备 份 服务 器 通过 业务 网 将 控制 流传 输 给 应 用 服务 器 ， 客 户 端 代理 响应 请 求 ， 然 
后 通过 业务 网 将 所 需 备 份 数 据 传输 给 备份 服务 器 ， 并 由 备份 服务 器 将 数据 副本 存储 到 备 
份 存储 设备 上 。LAN-Base 这 种 拓扑 结构 的 优点 在 于 投资 经 济 ， 并 且 可 以 实现 备份 介质 的 
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共享 ， 管 理 集中 。 其 缺点 在 于 占用 业务 网 资源 ， 增 加 了 业务 网 络 传输 压力 ， 特 别 是 在 备 
份 数据 量 大 或 备份 频率 高 的 情况 下 ， 业 务 网 的 传输 性 能 会 受到 很 大 的 影响 ， 甚 至 会 出 现 
网 络 拥塞 并 造成 业务 中 断 ; 此 外 ， 备 份 代理 会 占用 应 用 服务 器 资源 ， 影 响 用 户 业 务 主机 
性 能 。 

LAN-Free 是 一 种 采用 前 端 业务 网 传输 控制 流 、 采 用 后 端 存 储 网 络 传输 数据 流 的 拓扑 
结构 ， 其 网 络 拓扑 如 图 11-6 所 示 。 


应 用 服务 器 备份 服务 器 






备份 存储 设备 


存储 设备 存储 设备 a 


图 11-6 LAN-Free 备份 拓扑 


LAN-Free 备份 系统 中 ， 备 份 管理 软件 模块 和 介质 代理 软件 模块 安装 在 备份 服务 器 
上 ， 两 个 客户 端 代理 模块 分 别 安 装 在 两 台 应 用 服务 器 上 。 执 行 备份 任务 时 ， 备 份 服务 器 
通过 业务 网 将 控制 流传 输 给 应 用 服务 器 ， 客 户 端 代理 响应 请 求 ， 并 通过 存储 网 络 将 所 需 
备份 数据 传输 给 备份 服务 器 ， 再 由 备份 服务 器 将 数据 副本 存储 到 备份 存储 设备 上 。 基 于 
LAN-Free 的 备份 拓扑 能 解决 LAN-Base 备份 占用 业务 网 带宽 的 问题 。 在 LAN-Free 拓扑 结 
构 下 ， 备 份 数据 流 不 占用 业务 网 资源 ， 并 且 在 不 影响 用 户 业 务 网 络 性 能 的 情况 下 大 大 提 
高 系统 备份 性 能 。 但 是 ， 引 入 存储 网 络 会 增加 额外 开支 ， 同 时 ， 备 份 代理 影响 应 用 服务 
器 性 能 的 问题 也 没有 得 到 解决 。 
11.1.2 ”备份 技术 

数据 备份 往往 采用 各 种 备份 技术 来 实现 ， 应 用 较为 广泛 的 备份 技术 有 重复 数据 删除 
技术 “、 连 续 数 据 保护 技术 ”、 网 络 数据 管理 协议 技术 “等 。 

重复 数据 删除 (Data Deduplication) 也 称 为 去 重 或 消 见 ， 是 一 种 利用 算法 消除 重 
复数 据 的 技术 ， 其 目的 在 于 减 小 数据 占用 的 存储 空间 。 重 删 技 术 的 基本 原理 是 将 数据 
按 一 定 粒度 进行 切 分 ， 对 相同 的 数据 只 保存 一 次 ， 消 除 元 余 重 复数 据 进而 减 小 数据 存 
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储 空间 。 

重 删 技 术 在 不 同 的 维度 上 有 不 同 的 分 类 方式 : 

根据 重 删 实施 位 置 ， 可 以 分 为 源 端 重 删 和 目标 端 重 删 。 源 端 重 删 是 指 先 删 除 重复 数 
据 ， 再 将 重 删 后 数据 传输 到 备份 存储 设备 ;目标 端 重 删 是 指 先 将 数据 传输 到 备份 存储 设 
备 ， 存 储 数据 时 再 删除 重复 数据 。 

根据 重 删 实施 时 机 ， 可 以 分 为 在 线 重 删 (0nline Data Deduplication)、 后 处 理 重 
删 ( Post-processing Data Deduplication ) 和 自 适应 重 删 (Adaptative Data 
Deduplication)。 在 线 重 删 是 指数 据 写 入 磁盘 之 前 进行 重复 数据 删除 ， 后 处 理 重 删 是 指 
数据 写 入 磁盘 之 后 进行 重复 数据 删除 ; 自 适 应 重 删 是 指 性 能 要 求 较 低 时 采用 在 线 重 删 ， 
性 能 要 求 较 高 时 采用 后 处 理 重 删 。 

根据 重 删 粒 度 大 小 ， 可 以 分 为 文件 级 重 删 、 块 级 重 删 和 字 节 级 重 删 。 文 件 级 重 删 也 
称 单 实例 存储 ， 是 指 根据 索引 检查 需要 存储 文件 的 属性 ， 以 文件 为 单位 进行 重 删 操作 ， 
块 级 重 删 是 指 将 文件 /对 象 分 解 成 固定 大 小 或 不 定 大 小 的 数据 块 , 以 数据 块 为 单位 进行 重 
删 操 作 : 字 节 级 重 删 是 指 从 字 节 层次 查找 和 删除 重复 的 内 容 ， 一 般 通 过 差异 压缩 策略 生 
成 差异 部 分 内 容 ， 实 现 对 用 户 数据 进行 压缩 存储 ， 字 节 级 消 元 的 优点 是 去 重 率 比较 高 ， 
缺点 是 去 重 速度 比较 慢 。 

根据 重 删 范围 ， 可 以 分 为 本 地 重 删 和 全 局 重 删 。 本 地 重 删 在 查找 重复 数据 时 ， 仅 和 
当前 存储 设备 内 的 数据 进行 比较 ， 而 全 局 重 删 在 查找 重复 数据 时 ， 需 要 和 整个 重 删 域 中 
的 所 有 存储 设备 的 数据 进行 比较 。 

如 图 11-7 所 示 ， 以 固定 大 小 的 块 级 重 删 为 例 描述 重复 数据 删除 过 程 ; 首先 ， 将 需 
要 存储 的 数据 按 一 定 粒度 切 成 固定 大 小 的 块 ， 如 4KB、16KB 或 32KB; 然后 ， 以 块 为 单位 
进行 哈 希 运算 ， 所 得 哈 希 值 类 似 于 数据 块 的 指纹 信息 ， 内 容 相 同 的 数据 块 具 有 相同 的 指 
纹 信 息 ， 如 此 便 可 以 通过 匹配 指纹 的 方式 确认 数据 块 的 内 容 是 否 相 同 ， 大 大 简化 了 对 比 
匹配 的 过 程 ， 接 着 ， 将 数据 块 与 已 存在 于 存储 中 的 数据 块 进 行 指纹 匹配 ， 对 于 之 前 已 经 
存储 过 的 数据 块 不 再 进行 重复 存储 ， 只 利用 其 哈 希 值 作 为 索引 信息 记录 该 数据 块 ， 并 通 
过 映射 将 数据 块 的 索引 信息 与 具体 存放 位 置 对 应 起 来 , 对 于 之 前 没有 存储 过 的 新 数据 块 ， 
先进 行 物理 存储 ， 再 利用 哈 希 索 引 值 进 行 记 录 。 按 照 上 述 流程 ， 便 可 保证 相同 的 数据 块 
在 物理 介质 上 只 存储 一 次 ， 达 到 删除 重复 数据 的 目的 ， 同 时 ， 通 过 哈 希 索引 值 ， 可 以 看 
到 完整 的 数据 块 逻 辑 视图 , 结合 逻辑 视图 与 物理 存储 , 便 可 以 呈现 完整 的 原 数据 块 集合 。 

重 删 技术 对 数据 备份 而 言 是 非常 有 价值 的 ， 可 以 节省 存储 空间 ， 提 高 存储 资源 利用 
率 ， 降 低 用 户 的 总 拥有 成 本 “TC0)， 减 少 备份 任务 所 需 的 完成 时 间 。 另 外 ， 应 用 广泛 的 
压缩 技术 同样 可 以 达到 节省 存储 空间 的 目的 ， 那 么 数据 压缩 技术 和 重复 数据 技术 两 者 有 
何 区 别 呢 ? 数据 压缩 是 在 不 改变 原始 数据 的 情况 下 ， 针 对 单个 文件 采用 空 值 压 缩 或 缩短 
高 频数 据 表 示 值 的 方法 ， 达 到 缩小 数据 的 目的 ， 而 重 删 技术 可 看 作 一 种 特殊 的 压缩 ， 是 


== 一 


数据 存储 技术 


基于 一 定 的 数据 粒度 ， 保 留 唯一 的 数据 源 ， 跨 文件 消除 重复 数据 ， 从 而 实现 降低 数据 存 
储 空间 的 目的 。 


重 删 后 数据 
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一 读本 + 
图 11-7 重复 数据 删除 

连续 数据 保护 技术 (Continual Data Protection，CDP)， 是 一 套 基 于 备份 的 数据 
保护 方法 ， 通 过 实时 捕获 或 跟踪 数据 的 变化 ， 并 将 变化 了 的 数据 隔离 于 生产 数据 进行 独 
立 存放 ， 确 保 数 据 可 以 恢复 到 过 去 的 尽 可 能 多 的 时 间 点 。CDP 技术 的 使 用 ， 可 以 实现 以 
应 用 为 中 心 的 容 灾 恢 复 ， 将 数据 恢复 到 自 该 备份 方案 实施 之 后 的 任意 时 间 点 。 利 用 CDP 
技术 可 以 提高 数据 的 可 用 性 ， 通 过 将 数据 捕获 并 复制 到 一 个 独立 的 存储 区 域 来 保障 用 户 
关键 业务 数据 的 可 用 性 ， 当 某 种 因素 导致 业务 中 断 时 ， 将 最 近 时 间 点 的 备份 数据 快速 恢 
复出 来 ， 尽 可 能 地 缩短 停机 时 间 。 

根据 恢复 粒度 不 同 ，CDP 可 以 分 为 True CDP 和 Near CDP。True CDP 技术 是 连续 不 
间断 地 监控 并 备份 数据 ， 可 以 将 数据 恢复 到 过 去 任意 时 间 点 ， 是 真正 的 实时 备份 。Near 
CDP 技术 是 按照 一 定 的 时 间 频 率 记录 并 备份 数据 ， 每 次 备份 有 一 定时 间 窗 口 ， 当 需要 恢 
复数 据 时 ， 可 以 恢复 到 过 去 备份 的 时 间 点 ， 备 份 时 间 频 率 越 高 就 越 接近 于 连续 备份 ， 但 
并 不 能 形成 完全 意义 上 的 连续 保护 。 实 际 应 用 中 ， 大 多 数 CDP 备份 产品 都 采用 Near CDP 
技术 ， 而 True CDP 技术 应 用 较 少 ， 原 因 有 两 点 : 一 方面 是 由 于 True CDP 技术 实现 难度 
较 大 ， 需 要 做 到 连续 不 间断 地 监控 和 记录 数据 的 变化 ; 另 一 方面 是 由 于 True CDP 备份 数 
据 占 用 存储 空间 较 大 ， 连 续 备 份 产生 的 数据 量 远 大 于 其 他 备份 方式 产生 的 数据 量 ， 对 存 
储 系统 造成 巨大 容量 压力 ， 也 给 用 户 造成 费用 负担 。 

网 络 数据 管理 协议 (Network Data Management Protoco1，NDMP) 是 一 种 用 于 网 络 
数据 备份 与 恢复 的 开放 性 通信 协议 。 遵 循 NDMP 标准 的 服务 器 不 需要 安装 其 他 备份 代理 ， 
即 可 被 NDMP 兼容 的 备份 软件 控制 进行 数据 备份 和 恢复 。NDMP 的 初衷 是 在 任何 备份 软件 
应 用 与 网 络 连接 存储 设备 之 间 提 供 一 种 通用 接口 ， 使 得 备份 应 用 厂商 在 各 种 网 络 连接 服 
务 器 上 控制 本 机 备份 和 恢复 设备 。 最 初 ，NDMP 由 NetworkAppliance 和 LegatoSystems 
公司 联合 开发 设计 ， 并 被 存储 行业 所 广泛 采用 ; 目前， 存储 网 络 工业 协会 (SNIA7 成 并 
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村 一 个 工作 组 专门 负责 制定 此 协议 标准 。 

NDMP 定义 了 一 套 机 制 和 协议 用 于 扩展 备份 、 恢复 以 及 其 他 在 主 存储 系统 和 二 级 存储 
系统 之 间 的 数据 传输 。 当 参与 备份 和 恢复 的 各 方 都 遵循 NDMP 协议 时 , 数据 提供 方 只 需要 
关注 数据 的 获取 和 提交 的 控制 ， 数 据 接收 方 只 需要 负责 数据 的 接收 及 存储 的 控制 ， 存 储 
管理 软件 仅仅 负责 数据 备份 和 数据 恢复 的 控制 ， 而 与 数据 提供 方 和 接收 方 所 操作 数据 的 
具体 内 容 无 关 。NDMP 通过 将 传统 数据 备份 和 恢复 方式 中 三 方 〈 服 务 器 一 备份 软件 一 备份 
设备 ) 之 间 的 控制 流 和 数据 流 的 通信 接口 分 离 并 标准 化 ， 从 而 实现 数据 备份 和 恢复 在 网 
络 级 的 完全 互 操作 性 ， 即 备份 三 方 无 关 特 性 。 

数据 管理 应 用 程序 (Data Management Application，DMA) 控制 NDMP 会 话 。NDMP 
主机 是 被 DMA 控制 执行 备份 或 恢复 操作 的 主机 。NDMP 服务 是 提供 给 存储 设备 的 NDMP 接 
口 , 它 可 以 由 状态 机 模型 来 表示 。NDMP 协议 规定 了 三 类 服务 : 数据 服务 、 磁 带 服务 和 SCSI 
服务 。 数 据 服务 是 在 主 存储 系统 和 客户 机 之 间 传 输 数 据 的 NDMP 服务 ，DMA 通过 它 来 读 写 
卷 及 文件 系统 的 数据 并 进行 数据 备份 或 恢复 ;磁带 服务 是 在 二 级 存储 系统 和 客户 机 之 间 
传输 数据 的 NDMP 服务 ，DMA 通过 它 来 访问 和 操作 二 级 存储 系统 ，SCSI 服务 是 将 SCSI 命 
令 传送 到 SCSI 设备 的 NDMP 服务 , DMA 通过 它 来 控制 挂 接 在 SCSI 总 线 或 光纤 通道 上 的 存 
储 介质 更 换 器 (如 磁带 库 的 机 械 手臂)。 


11.1.3 备份 策略 的 制订 


备份 策略 决定 着 整个 备份 系统 如 何 按照 一 定 的 规则 执行 相应 操作 或 步 又， 备份 策略 
的 制定 需要 明确 备份 对 象 、 备 份 目的 地 、 备 份 类 型 、 数 据 保 留 时 间 、 备 份 周 期 和 备份 窗 
此 等 ， 

1. 备份 对 象 

备份 对 象 是 指 需要 对 其 进行 备份 的 备份 源 ， 即 需要 保护 的 数据 。 备 份 的 数据 类 型 可 
以 是 文件 /文件 夹 、 数 据 库 、 罗 辑 卷 、 操 作 系 统 、 应 用 软件 …… 

2.， 备份 目的 地 

备份 目的 地 是 指 备份 介质 ， 即 指定 用 于 存放 备份 对 象 副 本 的 存储 设备 ， 其 可 以 是 磁 
盘 阵 列 、 磁 带 库 、 虚 拟 磁 带 库 、 光 盘 库 等 中 的 一 种 或 多 种 。 应 用 系统 的 数据 备份 决定 了 
该 系统 的 可 靠 性 及 可 维护 性 ， 因 此 数据 备份 系统 的 建设 需要 充分 考虑 可 靠 性 、 可 管理 性 
及 维护 成 本 等 多 方面 因素 。 不 同 的 备份 介质 对 应 着 不 同 的 备份 结构 ， 常 见 的 备份 结构 包 
括 以 下 几 种 。 

磁盘 一 磁盘 结构 (Disk to Disk，D2D)， 适 用 于 数据 量 较 大 、 备 份 窗口 较 小 、 性 能 
要 求 较 高 的 场合 ， 如 数据 中 心 ， 此 外 ， 它 不 支持 数据 离线 保存 。 

磁盘 一 物理 磁带 库 结 构 (Disk to Physical Tape Library，D2T)， 适 用 于 备份 数 
据 量 不 大 、 时 间 窗 口 宽裕 、 离 线 异 地 长 期 保存 的 场景 。 
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磁盘 一 虚拟 磁带 库 结构 (Disk to Virtual Tape Library，D2V)， 适 用 于 需要 继承 
企业 原 有 磁带 备份 架构 和 策略 ， 又 需要 提高 备份 速度 的 场景 。 

磁盘 一 虚拟 磁带 库 一 物理 磁带 结构 (Disk to Disk to Physical Tape Library， 
D2D2T)，D2D2T 的 备份 方式 兼 具 了 高 可 靠 性 、 高 可 管理 性 以 及 高 性 能 等 多 方面 优势 ， 是 
适应 性 最 强 的 备份 方式 。 其 优势 在 于 : 1) 采用 物理 磁盘 作为 一 级 备份 介质 ， 通 过 RAID 
技术 进行 元 余 保 护 ， 提 高 了 性 能 和 可 靠 性 ; 2) 采用 虚拟 磁带 库 技术 确保 主机 端 备 份 系统 
的 可 管理 性 和 安全 性 ; 3 ) 虚拟 磁带 库 系 统 能 够 支持 按 需 存储 功能 , 提高 存储 空间 利用 率 ; 
4) 虚拟 磁带 库 系统 能 够 支持 将 虚拟 磁带 的 数据 导入 物理 磁带 的 功能 ， 以 便 用 物理 磁带 库 
充当 二 级 备份 介质 ， 实 现 备份 数据 的 归档 保存 及 异地 保存 。 

3， 备份 类 型 与 备份 周期 

根据 所 采用 的 备份 方式 不 同 ， 备 份 类 型 大 致 分 为 三 类 ， 即 全 备份 、 差 异 备份 和 增 量 
备份 ， 如 图 11-8 所 示 。 备 份 周 期 代表 备份 作业 的 频率 ， 可 以 是 每 天 、 每 周 、 每 月 ……. 





差异 备份 增 量 备份 
Sun. ER | | | 
Mon. 中 | 
Tue [| | 
Wed. [re 
Thu. En | 
| Sat a 
, i Osun ET | EE 
。 易 于 管理 。 每 天 进行 一 次 差异 备份 。 每 天 进行 增 量 备份 


图 11-8 备份 类 型 


全 备份 又 称 为 全 量 备 份 ， 是 指 在 某 一 个 时 间 点 上 所 有 数据 的 一 个 完整 拷贝 ， 即 ， 将 
所 选 备份 内 容 的 所 有 数据 进行 备份 。 在 备份 发 起 后 到 备份 结束 的 这 个 阶段 ， 如 有 数据 变 
动 ， 改 变 的 部 分 数据 将 在 下 次 备份 操作 时 再 进行 备份 。 使 用 全 备份 方式 ， 备 份 过 程 所 需 
时 间 较 长 ， 备 份 数据 占用 的 空间 也 较 大 ， 而 且 在 数据 改动 频率 较 小 的 情况 下 ， 多 次 全 备 
份 的 内 容 很 可 能 相差 无 几 甚 至 完全 相同 。 但 在 恢复 数据 时 ， 只 需要 最 新 的 全 备份 副本 ， 
执行 一 次 恢复 操作 即 可 恢复 全 部 数据 ， 恢 复 性 能 很 高 。 

差异 备份 是 以 上 一 次 的 全 备份 为 基准 ， 仅 备份 新 产生 数据 或 更 改 数据 的 备份 方式 。 
如 果 此 次 备份 操作 以 前 未 进行 任何 过 备份 ， 则 此 次 备份 需 备 份 所 有 数据 。 差 异 备份 方式 
的 备份 速度 比 全 备份 快 ， 特 别 是 在 数据 改动 频率 较 小 的 情况 下 ， 差 异 备份 方式 的 性 能 优 
势 更 大 。 但 在 恢复 数据 时 ， 需 要 利用 最 新 的 全 备份 副本 和 最 新 的 增 量 备份 副本 ， 在 此 基 
础 上 ， 执 行 两 次 恢复 操作 并 将 所 得 的 两 个 数据 副本 进行 整合 ， 方 可 得 到 所 需 恢复 数据 ， 
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因此 其 恢复 时 间 比 全 备份 要 长 。 

增 量 备份 与 差异 备份 的 基准 是 不 同 的 ， 增 量 备份 是 以 上 一 次 备份 为 基准 ， 备 份 新 产 
生 或 更 改 的 数据 ， 而 不 管 上 次 是 全 备份 还 是 增 量 备份 。 如 果 此 次 备份 操作 之 前 未 进行 过 
任何 备份 ， 则 此 次 备份 需要 备份 所 有 数据 。 增 量 备份 需要 存储 的 数据 最 少 ， 备 份 速度 是 
三 种 备份 类 型 中 最 快 的 ， 但 恢复 数据 所 需要 的 时 间 是 最 长 的 。 因 为 恢复 数据 时 ， 必 须 具 
备 最 新 的 全 备份 副本 和 此 前 的 所 有 增 量 备份 副本 ， 在 此 基础 上 ， 执 行 多 次 恢复 操作 ， 整 
合 多 个 数据 副本 方 可 得 到 所 需 恢 复数 据 。 

选择 备份 类 型 时 ， 需 要 根据 不 同 的 备份 对 象 和 应 用 要 求 进行 具体 分 析 。 比 如 ， 对 于 
操作 系统 和 应 用 软件 而 言 ， 在 每 一 次 系统 更 新 或 者 安装 新 软件 之 后 需要 做 一 次 全 备份 ; 
对 于 每 天 需要 大 量 更 新 且 数据 总 量 不 大 的 关键 应 用 数据 而 言 ， 可 以 每 天 在 业务 空闲 时 候 
做 一 次 全 备份 ， 对 于 每 天 需要 少量 更 新 或 数据 总 量 较 大 的 关键 应 用 数据 而 言 ， 可 以 每 月 
或 每 周 做 一 次 全 备份 ， 在 此 基础 上 每 天 做 一 次 差异 备份 或 增 量 备份 。 

4. 数据 保留 时 间 

数据 保留 时 间 是 指 存放 在 介质 上 的 数据 副本 需要 保留 的 时 间 ， 即 备份 数据 有 效 时 
间 ， 可 以 是 一 周 、 一 月 、 一 年 、“* 。 系 统管 理 员 可 以 指定 每 次 备份 的 数据 可 以 保存 的 
时 间 ， 在 保存 期 限 内 的 数据 不 允许 被 覆盖 。 如 果 数 据 存放 时 间 超 过 了 保留 期 限 ， 备 份 软 
件 会 自动 将 该 备份 数据 的 相关 信息 从 备份 软件 数据 库 中 删除 ， 即 使 没有 从 磁带 、 磁 盘 等 
存储 介质 上 对 数据 进行 删除 ， 用 户 也 无 法 检索 到 该 备份 数据 的 信息 。 

在 一 个 数据 生命 周期 内 ， 如 图 11-9 所 示 ， 重 要 的 数据 被 “创建 ”生成 后 ， 需 要 “ 保 
护 ” 起 来 ， 而 且 可 能 经 常 被 “访问 ”。 一 段 时 间 后 ， 这 部 


分 数据 的 重要 性 和 被 访问 的 频率 可 能 会 降低 此 时 便 需 要 区 村 人 

将 其 “迁移 ”到 一 些 容量 大 、 性 能 低 的 存储 设备 上 ， 以 释 人 
放 容量 小 、 性 能 高 的 存储 介质 给 更 为 重要 的 热点 数据 使 ww 。。 a 
用 。 随 着 时 间 的 推移 ， 该 部 分 数据 的 重要 性 再 次 降低 , 此 

时 便 需 要 将 这 部 分 数据 “归档 ” 超过 预定 的 期 限 〈 即 ， “4 


超过 数据 保留 时 间 )， 这 部 分 数据 便 可 以 被 “删除 ” 即 备 迁移 访问 
份 数据 失效 。 Da 

5. 备份 窗口 图 11-9 数据 生命 周期 

备份 窗口 (Backup Window) 是 指 一 次 备份 操作 从 开始 至 结束 的 时 间 段 ， 可 以 理解 
为 在 不 影响 业务 应 用 程序 的 情况 下 , 完成 一 次 指定 备份 任务 所 需 的 时 间 。 弓 庸 置疑 的 是 ， 
业务 运行 时 应 用 服务 器 需要 通过 生产 存储 读 取 数 据 并 占用 网 络 带宽 进行 数据 传输 ， 而 数 
据 备份 时 ， 同 样 需要 通过 生产 存储 复制 数据 并 通过 网 络 传输 数据 。 如 果 应 用 程序 与 备份 
软件 同时 需要 对 同一 份 数据 进行 操作 时 , 存储 系统 该 如 何 响应 呢 ? 如 果 先 响应 备份 软件 ， 
业务 的 连续 性 或 多 或 少 会 受到 影响 ， 如 果 先 响应 应 用 程序 ， 备 份 操作 需要 暂时 搁置 ， 业 
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务 繁忙 时 甚至 需要 长 时 间 搁 置 ， 那 么 数据 丢失 的 风险 会 增 大 。 因 此 ， 备份 系统 需要 在 业 
务 连 续 性 和 备份 窗口 之 间作 出 相应 的 平衡 。 

以 在 LAN-Base 备份 组 网 架构 下 设置 备份 窗口 为 例 ， 如 图 11-10 所 示 ， 假 设 在 8:00 一 
20:00 时 间 段 内 该 业务 网 络 利用 率 非常 高 ， 而 且 基 于 该 局 域 网 运行 的 业务 连续 性 要 求 很 
高 。 若 在 此 时 间 段 设置 备份 窗口 ， 备 份 系统 需要 通过 业务 网 传输 控制 信号 和 数据 副本 ， 
备份 数据 流 必然 会 占用 业务 网 带宽 ， 进 而 对 用 户 的 业务 运行 造成 影响 。 因 此 在 设置 备份 
窗口 时 ， 应 尽量 选择 网 络 利 用 率 不 高 的 时 间 段 ， 以 确保 业务 的 连续 性 。 

单位 : % 


图 网 络 利用 率 





8:00 4:00 8:00 12:00 16:00 20:00 23:59 (时 间 ) 
图 11-10 网络 利用 率 时 间 分 布 


11.1.4 ”典型 备份 方案 


虚拟 磁带 库 (VTL) 作为 备份 介质 自身 拥有 诸多 优势 : 1) 由 于 没有 机 械 零 部 件 ，VTL 
的 可 靠 性 和 可 维护 性 相 比 于 物理 磁带 库 有 了 很 大 的 提高 ; 2) VTL 采用 物理 磁盘 作为 存储 
介质 ， 具 有 较 高 访问 性 能 ， 而 且 可 以 采取 压缩 、 重 复数 据 删 除 等 技术 进行 备份 ， 其 读 / 
写 性 能 高 于 物理 磁带 库 ，3) 虚拟 磁带 库 采 用 了 虚拟 化 引擎 ， 从 服务 器 的 角度 ， 它 是 一 个 
磁带 库 ， 操 作 系统 只 有 通过 特定 的 备份 软件 才能 够 对 其 进行 读 写 操作 ， 避 免 了 数据 被 误 
删除 或 被 病毒 感染 等 问题 。 然 而 对 于 备份 数据 量 巨大 的 中 高 端 用 户 而 言 ， 选 择 VTL 产品 
也 会 面临 容量 扩展 性 不 足 、 能 耗 过 高 等 问题 。 针 对 此 ， 华 为 推出 一 种 VTL 集中 备份 解决 
方案 ， 即 ， 新 一 代 基于 VTL6900 的 数据 保护 方案 ， 如 图 11-11 所 示 。VTL 集中 备份 解决 
方案 能 够 很 好 地 满足 中 高 端 用 户 对 备份 系统 提出 的 大 容量 、 高 性 能 、 高 可 靠 以 及 节能 降 
耗 等 要 求 。 

VTL6900 是 一 款 面向 中 高 端 用 户 的 虚拟 磁带 库 产品 , 它 支 持 重 复数 据 删除 、HA 集群 、 
IP 复制 、 磁带 缓冲 、 磁盘 休眠 、 远程 复制 等 多 种 技术 。VTL 集中 备份 解决 方案 利用 VTL6900 
系列 产品 给 用 户 提供 灵活 的 备份 架构 设计 ， 以 满足 不 同 应 用 场景 。 其 中 ， 一 体 机 设备 集 
备份 软件 、 备 份 服务 器 和 备份 介质 于 一 体 ， 部 署 简单 灵活 并 且 成 本 低 ， 适 用 于 小 型 集中 
式 数据 备份 ， 单 节点 设备 由 单 引擎 (备份 服务 器 ) 与 存储 阵列 组 成 ， 性 价 比 高 ， 管 理 维 
护 方便 ， 适 用 于 中 小 型 集中 式 数据 备份 ， 多 节点 设备 由 引擎 集群 与 存储 阵列 组 成 ， 支 持 
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数据 并 发 备份 ， 稳 定 可 靠 且 性 能 高 ， 适 用 于 大 规模 集中 式 数 据 备份 。VTL 集中 备份 解决 
方案 实现 了 生产 数据 的 集中 备份 ， 并 且 支 持 数据 在 存储 端 进行 在 线 重 删 或 者 后 台 重 删 ， 
既 不 占用 业务 主机 资源 又 能 节省 存储 空间 资源 。 


VTL 集 中 化 备份 解决 方案 















在 线 /后 台 重 删 





虚拟 磁带 库 


图 11-11 VIL 集 中 备份 解决 方案 


上 述 VTL 集中 备份 解决 方案 采用 了 磁盘 一 虚拟 磁带 库 结构 (D2V), 而 华为 推出 的 VTL 
备份 归档 一 体 化 解决 方案 则 采用 了 磁盘 一 虚拟 磁带 库 一 物理 磁带 结构 〈D2D2T)。 如 
图 11-12 所 示 ，VTL 备份 归档 一 体 化 解决 方案 利用 高 性 能 的 虚拟 磁带 库 (VTL6900〉 和 支 
持 离线 长 久保 存 的 物理 磁带 库 作 为 备份 介质 ， 将 高 效 备份 和 智能 归档 融合 于 一 体 。 


备份 服务 器 





虚拟 磁带 库 





图 11-12 VTL 备份 归档 一 体 化 解决 方案 


一 
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备份 归档 一 体 化 设计 具有 以 下 高 可 管理 性 、 高 性 价 比 、 高 存储 利用 率 等 优势 。 

(1) VTL6900 存储 性 能 较 高 并 且 可 以 自动 备份 数据 到 带 库 中 ， 数 据 管理 简单 、 便 捷 、 
Rs 

(2) 物理 磁带 库 可 以 实现 大 量 数据 的 离线 归档 和 长 期 保存 ， 而 且 VTL6900 可 兼容 现 
存 的 物理 带 库 ， 节 约 成 本 ; 

《3) 使 用 重 删 技 术 对 备份 和 归档 数据 进行 去 元 ， 节 省 存储 空间 资源 ， 降 低 网 络 传输 
量 ， 缩 短 备份 和 归档 窗口 。 


数据 对 企业 的 重要 性 不 言 而 喻 ， 数 据 备份 往往 是 在 同一 个 数据 中 心 内 部 对 数据 进行 
本 地 保护 的 一 种 数据 保护 方式 ， 保 存 的 是 历史 数据 。 备 份 技术 在 一 定 程度 上 可 以 防范 操 
作 失 误 、 病 毒 、 人 为 破坏 、 软 件 缺 陷 、 系 统 故障 等 因素 引起 的 数据 逻辑 错误 。 然 而 ， 如 
果 发 生 设备 级 故障 、 数 据 中 心 级 灾难 或 区 域 性 灾难 ， 就 有 可 能 造成 整个 数据 中 心 的 永久 
性 数据 丢失 ， 此 时 ， 基 于 数据 中 心 内 部 的 数据 备份 便 无 能 为 力 了 。 设 备 级 故障 是 指 硬盘 
损坏 、 存 储 设备 组 件 损坏 、 整 个 存储 系统 宕 机 等 情况 ， 数 据 中 心 级 灾难 是 指数 据 中 心 长 
期 电源 故障 、 空 调 故 障 、 火 灾 等 原因 导致 的 整个 业务 系统 瘫痪 的 情况 ， 区 域 性 灾难 是 指 
水 灾 、 地 震 等 重大 灾难 导致 整个 区 域 的 IT 系统 瘫痪 的 情况 。 为 了 有 效应 对 这 些 灾难 和 故 
障 对 业务 系统 连续 性 和 数据 安全 性 带 来 的 挑战 , 企业 IT 系统 需要 引入 容 灾 备份 方案 ， 以 
保证 企业 业务 的 连续 性 和 企业 信息 系统 可 用 性 。 


11.2.1 容 灾 概念 


容 灾 通常 是 指 在 本 地 或 者 异地 ， 建 立 一 套 或 多 套 具 备 生产 主 系统 功能 的 IT 系统 ， 
并 实时 或 周期 性 同步 生产 数据 ”。 容 灾 系 统 和 生产 系统 二 者 之 间 通 过 健康 状态 监测 ， 在 
灾难 发 生 时 实现 功能 切换 ， 以 防止 设备 级 故障 、 数 据 中 心 级 故障 或 区 域 性 灾难 等 造成 的 
数据 永久 性 丢失 或 IT 系统 业务 中 断 。 生 产 过程 中 ， 一 旦 生产 系统 出 现 意外 并 停止 工作 ， 
整个 业务 可 以 快速 切换 到 容 灾 系 统 , 实现 生产 数据 的 快速 恢复 , 保证 生产 业务 的 连续 性 。 

生产 数据 对 业务 应 用 的 重要 性 不 言 而 喻 ， 任 何 一 个 容 灾 方案 ， 都 需要 满足 将 生产 数 
据 由 生产 系统 实时 或 者 周期 性 的 同步 至 灾 备 系统 这 一 基本 要 求 , 这 就 是 所 谓 的 数据 容 灾 。 
数据 容 灾 通常 是 采用 数据 复制 技术 来 实现 的 ， 数 据 复制 技术 是 容 灾 技 术 的 核心 ， 涉 及 到 
的 主要 技术 包括 ， 基 于 日 志 的 复制 、 基 于 文件 系统 的 复制 、 基 于 卷 的 复制 和 镜像 、 基 于 
数据 块 的 复制 和 镜像 等 。 

主机 镜像 是 指 将 本 地 应 用 服务 器 上 的 应 用 或 数据 ， 通 过 局 域 网 或 广域网 复制 到 远 端 
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服务 器 的 数据 同步 方式 。 远 程 复制 是 容 灾 过 程 中 常用 的 一 种 数据 镜像 技术 ， 将 本 地 设备 
的 业务 数据 通过 网 络 实时 或 周期 性 地 复制 到 远 端 设 备 上 ， 以 达到 数据 保护 或 灾难 恢复 的 
目的 。 实现 远程 复制 功能 的 技术 较 多 , 使 用 最 为 广泛 的 主要 有 同步 复制 和 异步 复制 两 种 。 

如 图 11-13 所 示 ， 同 步 复 制 是 将 本 地 设备 的 业务 数据 实时 地 复制 到 远程 设备 上 ， 需 
要 在 两 个 设备 之 间 建 立 安全 的 链接 。 当 应 用 向 存储 设备 中 写 入 数据 时 ， 主 机 必须 等 待 本 
地 设备 和 远 端 设备 都 成 功 写 入 并 返回 写 入 确认 信息 后 ， 才 能 向 应 用 反馈 写 六 成 功 信号 。 
数据 从 本 地 设备 发 送 到 远 端 设备 ， 再 由 远 端 设备 将 应 答 信 和 号 发 回 本 地 所 历经 时 间 称 为 往 
返 时 间 。 同 步 复 制 可 以 确保 了 两 端 设备 数据 严格 一 致 ， 可 靠 性 较 高 ， 然 而 ， 如 果 两 地 距 
离 过 长 ， 往 返 时 间 随 着 增加 ， 这 意味 着 应 用 处 于 等 待 状态 的 时 间 也 会 增加 ， 应 用 性 能 将 
受到 有 影响。 因此， 同步 复制 常用 于 距离 较 近 、 网 络 延 迟 较 小 的 场景 。 
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图 11-13 远程 复制 工作 流程 


异步 复制 是 将 本 地 设备 的 数据 周期 性 地 复制 到 远程 节点 ， 并 且 本 地 主机 不 用 等 待 远 
端 设备 的 写 入 响应 ， 只 要 本 地 存储 成 功 写 入 数据 ， 便 可 向 应 用 反馈 写 入 成 功 信号 。 异 步 
复制 并 不 要 求实 时 数据 同步 ， 基 本 上 不 会 影响 应 用 的 响应 时 间 ;， 然 而， 异步 复制 可 能 无 
法 保证 两 端 设备 上 的 数据 严格 一 致 ， 灾 难 发 生 后 恢复 数据 时 可 能 会 造成 部 分 数据 丢失 。 
因此 ， 蜡 步 复 制 常 用 于 距离 较 远 、 网 络 延 迟 比较 大 的 场景 。 

如 图 11-14 所 示 ， 从 实现 复制 功能 的 设备 的 角度 ， 数 据 复制 技术 大 体 可 分 为 三 个 层 
次 ， 分 别 为 主机 层 、 网 络 层 和 存储 层 。 

主机 层 数据 复制 包括 数据 库 复 制 、 文 件 系 统 复制 、 卷 复制 或 卷 镜 像 等 ， 通 常 需 要 在 
生产 中 心 和 灾 备 中 心 的 服务 器 上 安装 专用 的 数据 复制 软件 ， 并 引入 网 络 连接 作为 两 中 心 
之 间 信 令 交 互 和 数据 传输 的 通道 ， 进 而 实现 远程 复制 功能 ， 最 后 达到 数据 容 灾 的 目的 。 
通过 在 服务 器 层 增 加 应 用 远程 切换 功能 的 软件 ， 便 可 以 构成 完整 的 应 用 级 容 灾 方案 。 主 
机 层 数据 复制 通常 只 需 采 购 相 关 软 件 而 无 需 添 购 一 系列 的 专用 设备 ， 相 对 投入 较 小 ; 同 
时 ， 羔 容 性 也 比较 好 ， 可 以 兼容 不 同类 型 的 服务 器 和 存储 设备 ， 对 于 硬件 组 成 较为 复杂 
的 生产 系统 而 言 ， 采 用 主机 层 数据 复制 是 个 很 不 错 的 选择 。 然 而 ， 数 据 复制 软件 通常 需 
要 安装 在 业务 主机 上 ， 通 过 软件 实现 数据 同步 操作 时 ， 必 定 会 占用 主机 资源 ， 可 能 会 对 
业务 主机 造成 一 定 的 性 能 影响 。 
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图 11-14 数据 复制 技术 


网 络 层 数据 复制 指 的 是 基于 虚拟 化 网 关 实 现 远 程 复制 和 镜像 功能 的 数据 复制 技 
术 。 虚 拟 化 网 关 又 称 为 存储 网 关 ， 是 指 能 实现 卷 复制 镜像 功能 的 存储 虚拟 化 设备 。 存 
储 网 关 在 位 于 不 同 存储 设备 上 的 两 个 卷 《 即 ， 主 卷 和 备份 卷 ) 之 间 建 立 复制 镜像 关系 ， 
将 写 入 主 卷 的 数据 同步 到 备份 卷 中 ， 当 主 存储 设备 发 生 故障 导致 主 卷 数据 丢失 时 ， 业 
务 可 以 切换 到 备用 存储 设备 上 并 启用 备份 卷 继续 运 作 ， 保 证 数据 业务 不 中 断 。 随 着 存 
储 交 换 机 技术 不 断 发 展 ， 原 来 由 服务 器 和 存储 设备 实现 的 许多 功能 ， 如 今 存 储 交 换 机 
也 能 实现 。 如 果 在 生产 中 心 和 灾 备 中 心 部 署 支持 数据 复制 功能 的 存储 交换 机 ， 并 在 存 
储 交换 机 之 间 部 署 专用 链 路 ， 便 可 实现 交换 机 对 生产 数据 的 管理 和 复制 。 网 络 层 数据 
复制 技术 的 优点 在 于 不 额外 占用 主机 资源 且 兼 容 性 好 ， 能 兼容 异 构 存 储 阵 列 。 其 不 足 
之 处 在 于 ， 由 于 支持 网 络 层 数 据 复制 功能 的 存储 交换 机 产品 尚未 得 到 推广 ， 其 价格 相 
对 较 高 。 

存储 层 数据 复制 包括 块 复制 技术 、NAS 复制 技术 以 及 虚拟 化 存储 阵列 中 的 镜像 技术 。 
目前 的 存储 设备 一 般 都 具有 先进 的 数据 管理 功能 ， 远 程 数据 复制 功能 几乎 是 现 有 中 高 端 
存储 产品 的 必 备 功能 ， 基 于 存储 系统 的 复制 镜像 功能 足以 实现 生产 中 心 和 灾 备 中 心 之 间 
的 生产 数据 同步 。 存 储 层 数据 复制 相关 技术 非常 成 熟 ， 一 方面 ， 数 据 复 制 操作 独立 于 业 
务 主机 ， 不 会 给 业务 主机 造成 额外 负担 ， 另 一 方面 ， 可 以 通过 在 应 用 层 增加 远程 集群 软 
件 来 实现 自动 灾难 切换 功能 。 目 前 ， 这 种 自动 灾难 切换 方案 具有 稳定 性 高 、 不 占用 业务 
主机 资源 、 自 动 化 程度 高 等 优势 ， 是 容 灾 方 案 的 主流 选择 。 
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11.2.2 ” 容 灾 分 类 


不 用 的 业务 系统 需要 不 同等 级 的 保护 。 根 据 对 系统 保护 程度 不 同 ， 容 灾 可 以 分 为 数 
据 级 容 灾 、 应 用 级 容 灾 和 业务 级 容 灾 。 

数据 级 容 灾 是 一 种 通过 建立 容 灾 中 心 来 实现 数据 远程 备份 的 数据 容 灾 方式 ， 它 针对 
的 是 生产 资料 的 容 灾 ， 其 保护 对 象 是 生产 系统 的 数据 ， 其 目的 在 于 防止 意外 或 灾难 造成 
生产 数据 的 永久 性 丢失 。 与 前 面 所 述 的 数据 备份 类 似 ， 当 生产 数据 由 于 某 种 原因 失效 ， 
生产 系统 需要 通过 远程 复制 等 技术 将 数据 从 远程 的 容 灾 中 心 恢复 到 本 地 ， 这 个 过 程 往往 
耗 时 较 长 。 所 以 ， 数 据 级 容 灾 在 灾难 发 生 时 ， 需 要 中 断 应 用 进行 数据 的 恢复 ， 无 法 保证 
业务 的 连续 性 。 相 比 于 其 他 容 灾 级 别 〈 如 应 用 级 容 灾 和 业务 级 容 灾 )， 数 据 级 容 灾 具 有 投 
入 成 本 低 、 实 施 简单 等 优势 。 

应 用 级 容 灾 针 对 的 是 生产 者 和 生产 资料 的 容 灾 ， 其 保护 对 象 主要 是 生产 系统 的 应 用 
及 数据 ， 除 了 需要 实时 或 周期 性 备份 生产 数据 之 外 ， 还 需 在 容 灾 中 心 构建 一 套 能 接管 生 
产业 务 的 应 用 系统 。 一 方面 ， 通 过 同步 或 异步 复制 技术 来 尽 可 能 保持 主 备 生产 系统 的 数 
据 统 一 ; 另 一 方面 , 通过 多 种 软件 实现 多 种 应 用 程序 在 主 备 生 产 系统 之 间 进 行 快速 切换 ， 
确保 灾难 发 生 时 关键 应 用 可 以 在 业务 可 容忍 的 时 间 间 隔 内 恢复 运行 。 通 过 对 生产 系统 实 
施 应 用 级 容 灾 ， 有 助 于 保证 系统 所 提供 服务 是 完整 而 可 靠 的 ， 进 而 保证 用 户 业 务 是 连续 
的 ， 从 而 尽 可 能 减少 灾难 带 来 的 损失 。 

业务 级 容 灾 是 针对 生产 环境 、 生 产 者 和 生产 资料 的 全 面容 灾 ， 其 保护 对 象 是 整个 生 
产 系统 及 其 运作 的 环境 。 业 务 级 容 灾 是 全 业务 的 灾 备 ， 除 了 需要 同步 生产 数据 和 备份 应 
用 程序 , 还 需要 构建 一 套 具 备 全 部 基础 设施 和 相关 技术 的 完整 IT 系统 ,甚至 需要 备份 一 
些 与 IT 系统 无 关 的 设施 ， 如 电话 、 办 公 地 点 等 。 灾 难 发 生 时 ， 原 有 的 生产 系统 和 办 公 场 
所 都 可 能 会 受到 破坏 ， 数 据 和 应 用 可 以 从 容 灾 中 心 的 备份 系统 中 进行 恢复 ， 正 常 开展 业 
务 需 要 的 工作 场所 自然 也 可 以 由 容 灾 中 心 提 供 。 


11.2.3 ” 容 灾 系统 衡量 指标 


容 灾 的 目的 是 为 了 生产 系统 在 灾难 发 生 后 能 够 以 最 快速 度 恢 复 服务 ， 尽 可 能 保障 业 
务 的 连续 性 。 不 同业 务 对 连续 性 要 求 不 尽 相 同 ， 自 然 地 ， 不 同业 务 系统 对 容 灾 系 统 数据 
恢复 能 力 要 求 也 有 所 差异 ， 因 此 在 容 灾 系 统 建设 之 初 ， 需 要 通过 与 业务 部 门 进行 风险 分 
析 和 业务 影响 分 析 ， 得 到 具体 的 设计 指标 。 最 常见 的 容 灾 系统 衡量 指标 有 RTO 和 RP0， 
如 图 11-15 所 示 。 

恢复 时 间 目 标 (Recovery Time 0bjective，RT0) 指 灾难 发 生 后 ， 信 息 系 统 或 业务 
功能 从 停止 运作 至 必须 恢复 运作 的 时 间 要 求 ， 反 映 的 是 业务 恢复 的 及 时 性 。RT0 表示 业 
务 从 中 断 到 恢复 正常 所 需 的 时 间 ，RTO 值 越 小 表明 业务 中 断 时 间 越 短 。 
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图 11-15 容 灾 的 关键 指标 


恢复 点 目标 (Recovery Point Objective，RP0) 指 灾 难 发 生 后 ， 信 息 系统 和 业务 
数据 必须 恢复 到 的 时 间 点 要 求 ， 反 映 的 是 恢复 数据 的 完整 性 ，RP0 值 越 小 表明 丢失 的 数 
据 越 少 。 实 际 应 用 中 ， 由 于 数据 传输 和 备份 时 间 粒 度 等 因素 ， 业 务 数据 库 与 容 灾 备份 数 
据 库 的 数据 无 法 实时 同步 ， 二 者 并 非 完全 相同 的 ， 也 就 是 说 它们 在 生产 时 间 线 上 存在 一 
定 的 时 差 , 这 个 时 间 差 即 为 RP0， 从 这 个 角度 ,RP0 衡量 的 是 业务 数据 库 与 灾 备 数据 库 二 
者 在 这 个 时 间 差 内 的 差异 数据 的 量 ， 即 灾难 造成 的 数据 损失 量 。 

以 某 应 用 发 生 灾难 并 恢复 的 具体 过 程 为 例 ， 如 图 11-16 所 示 ， 某 应 用 在 本 地 有 一 个 
生产 中 心 ， 在 相隔 甚 远 的 异地 有 一 个 容 灾 中 心 ， 彼 此 之 间 以 异步 数据 复制 的 方式 进行 生 
产 数据 的 备份 , 每 隔 一 小 时 同步 一 次 生产 数据 。 假设 在 10:00 时 刻 完成 了 一 次 数据 同步 ， 
10:50 时 刻 生 产 系 统 出 现 故障 迫使 业务 暂停 ， 此 时 ， 生 产 系 统 中 的 数据 发 生 失 效 ， 而 容 
灾 系 统 中 的 数据 是 10:00 时 刻 的 生产 数据 ，10:00 至 10:50 这 50 分 钟 内 更 新 或 新 产生 的 
数据 将 无 法 恢复 ， 即 RP0 为 50 分 钟 ， 其 衡量 的 是 这 50 分 钟 内 丢失 的 数据 量 。 同 时 ， 生 
产 系 统 暂时 无 法 作业 ， 业 务 需 要 以 最 快 的 速度 切换 到 容 灾 系统 中 ， 应 用 切换 需要 一 定 的 
时 间 ， 于 13:00 时 刻 业 务 在 容 灾 系 统 中 正常 启动 运作 完成 切换 ，10:50 至 13:00 之 间 的 
130 分 钟 内 业务 处 于 中 断 状态 ， 即 RTO 为 130 分 钟 ， 其 衡量 的 是 业务 恢复 正常 所 消耗 的 
时 间 。 
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实际 应 用 中 ， 建 设 容 灾 系统 不 能 仅仅 参考 RT0 和 RP0 两 个 衡量 指标 ， 应 针对 不 同 的 
业务 系统 和 用 户 需求 ， 综 合 考虑 各 方面 因素 选择 最 适宜 的 容 灾 解 决 方案 ， 例 如 ， 某 些 地 
区 会 周期 性 地 发 生 特定 自然 灾害 , 需要 容 灾 备 份 中 心 与 生产 业务 中 心 保持 足够 远 的 距离 ， 
此 时 ， 距 离 要 求 将 成 为 建设 容 灾 系统 需要 参考 的 一 个 重要 指标 。 


11.2.4 ”典型 容 灾 解 决 方案 一 一 两 地 三 中 心 


设计 容 灾 方 案 需 要 考虑 多 方面 的 因素 ， 比 如 业务 特点 、 数 据 量 大 小 、 地 域 距离 、 灾 
难 恢复 速度 、 投 入 资金 等 。 从 不 同 出 发 点 设计 出 来 的 容 灾 方案 往往 有 所 不 同 。 针 对 不 同 
的 错误 、 故 障 或 灾难 而 设计 的 容 灾 方案 也 不 尽 相 同 ， 比 如 ， 应 对 设备 级 故障 可 以 用 本 地 
的 高 可 用 性 容 灾 方 案 ; 应 对 数据 中 心 级 故障 可 以 建立 同城 的 容 灾 站 点 ; 应 对 区 域 性 灾难 
可 以 建立 异地 的 容 灾 数据 中 心 。 

两 地 三 中 心 是 一 个 典型 容 灾 解决 方案 ， 两 地 指 本 地 和 异地 ， 三 中 心 指 生 产 中心 、 同 
城 容 灾 中 心 和 远程 容 灾 中 心 。 假 设 某 业务 对 可 靠 性 要 求 非常 高 ， 采 用 了 两 地 三 中 心 容 灾 
方案 部 署 了 主 站 点 、 同 城 灾 备 站 点 和 远程 灾 备 站 点 ， 实 现 对 生产 中 心 数据 及 业务 的 多 重 
保护 ， 如 图 11-17 所 示 。 





同城 灾 备 站 点 
同步 远程 复制 
存储 阵列 上 | 7 
异步 远程 复制 
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图 11-17 两 地 三 中 心 容 灾 解 决 方案 
主 站 点 的 生产 数据 可 以 在 同城 灾 备 站 点 和 远程 灾 备 站 点 都 进行 备份 ， 具 体 采 用 磁盘 
阵列 的 级 联 复制 功能 来 实现 ， 灾 难 发 生 时 可 以 进行 数据 级 恢复 。 主 站 点 与 同城 灾 备 站 点 
距离 相对 较 近 ， 可 以 采用 同步 复制 方式 进行 数据 实时 同步 ， 保 持 数据 严格 一 致 ， 即 保证 
RPO 为 零 。 同 城 灾 备 站 点 与 远程 灾 备 站 点 之 间距 离 相对 较 长 ， 为 了 降低 同步 操作 对 业务 
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主机 应 用 的 性 能 影响 ， 进 行 数据 级 容 灾 时 可 采用 异步 复制 方式 。 当 主 站 点 发 生 灾难 时 ， 
业务 可 快速 切换 到 同城 灾 备 站 点 ， 当 主 站 点 和 同城 灾 备 站 点 同时 发 生 灾难 时 ， 可 以 将 生 
产业 务 切换 到 远程 灾 备 站 点 ， 从 而 最 大 程度 地 保障 业务 的 连续 性 。 


11.3 ”本 章 小 结 


本 章 介 绍 了 备份 和 容 灾 技 术 ， 主 要 阐述 了 容 灾 备份 的 基本 概念 、 相 关 拉 术 及 其 相关 
解决 方案 。 备 份 是 一 种 为 了 防范 生产 过 程 中 由 于 逻辑 错误 导致 数据 永久 性 丢失 的 数据 保 
护 技 术 , 容 灾 是 针对 两 个 或 多 个 IT 系统 之 间 对 数据 、 应 用 或 业务 进行 保护 的 技术 。 其中， 
备份 小 节 着 重 介绍 了 备份 软件 、 备 份 网 络 拓扑 、 备 份 介 质 、 备 份 关键 技术 和 备份 策略 制 
定 过 程 ， 容 灾 小 节 着 重 介 绍 了 数据 容 灾 概念 、 容 灾 技 术 、 容 灾 分 类 、 容 灾 系 统 关键 衡量 
指标 。 


练习 题 


一 、 判 断 题 

1. 备份 软件 中 的 介质 服务 器 软件 模块 和 管理 服务 器 软件 模块 可 以 部 署 在 同一 台 服 
务 器 上 。( ) 

2. 差异 备份 是 以 第 一 次 的 全 备份 为 基准 ， 仅 备份 新 产生 或 更 改 的 数据 的 备份 方式 。 


3. 重 删 技术 进行 数据 切 分 的 时 候 ， 是 按 固定 大 小 进行 切 分 的 。(  ) 


、 选 择 题 

1. 常见 的 备份 介质 有 哪些 ?〈  ) 

A. 带 库 B. 磁盘 阵列 C， 虚 拟 带 库 D. 光盘 塔 / 库 

2. 重 删 数据 中 ， 按 照 重 删 粒度 ， 重 删 技术 可 以 分 为 ? (  ) 

A. 文件 级 重 删 B， 块 级 重 删 

C. 字 节 级 重 删 D. 源 端 重 删 

三 、 填 空 题 

1. LAN-Free 备份 服务 器 通过 ( ) 网 络 将 控制 流传 输 给 应 用 服务 器 ;而 客 
户 端 代理 响应 请 求 ， 通 过 ( ) 网 络 将 所 需 备 份 数据 传输 给 备份 服务 器 ， 再 由 备 
份 服务 器 将 数据 副本 存储 到 备份 存储 设备 上 。 

2. 容 灾 系 统 常用 衡量 指标 中 ，( ) 是 指 灾难 发 生 后 ， 信 息 系统 或 业务 功能 
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从 停止 运作 至 必须 恢复 运作 的 时 间 要 求 ， 值 越 小 表明 业务 中 断 时 间 越 〈 )， 
( ) 是 指 灾难 发 生 后 ,系统 和 数据 必须 恢复 到 的 时 间 点 要 求 , 值 越 小 表明 丢失 的 
数据 越 ( Ys 

四 、 思 考题 


1. 容 灾 和 备份 是 什么 关系 ? 容 灾 可 以 代替 备份 吗 ? 


2. 同步 复制 和 异步 复制 能 否 融合 使 用 ? 如 果 可 以 ， 应 该 如 何 规划 设计 ? 


3， 两 地 三 中 心 容 灾 解 决 方案 中 ， 是 否 可 以 在 主 站 点 与 远程 灾 备 站 点 之 间 采 用 异步 
复制 方式 进行 数据 级 容 灾 ? 为 什么 ? 


4. 数据 容 灾 过 程 中 能 否 使 用 重复 数据 删除 技术 ? 为 什么 ? 
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企业 、 政 府 、 研 究 所 等 机 构 购 买 存储 设备 或 存储 系统 往往 需要 进行 配置 与 部 署 。 具 
体 地 ,在 使 用 存储 系统 时 ,为 了 保证 业务 能 正常 、 顺 利 地 运行 ,往往 需要 人 为 参与 管理 ; 
而 存储 系统 在 运行 过 程 中 ， 经 常会 遇 到 因 操 作 不 当 等 因素 而 引起 的 人 为 故障 ， 导 致 业务 
中 断 ， 甚 至 数据 丢失 。 因 此 ， 人 掌握 存储 系统 的 配置 、 运 维和 管理 方法 是 至 关 重要 的 ， 本 
章 将 展开 详细 介绍 。 


六 
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| 学 5 四 。 掌握 存储 管理 软件 DeviceManager 的 基本 功能 与 操作 ; 
习 Si 了 。 了 解 存储 系统 初始 化 配置 ; 
长 = 。 掌握 SAN 和 NAS 存储 业务 配置 ; 
| 


和)，。 党 所 存储 基 术 运 维 管理 方法 





为 了 轻松 便捷 地 配置 、 管 理 和 维护 存储 设备 及 系统 ， 各 存储 厂商 都 会 结合 自身 独 有 
的 专利 技术 ， 开 发 自己 的 存储 管理 软件 。 例 如 ，DeviceManager 便 是 一 款 面向 华为 存储 
系统 的 存储 管理 平台 软件 。 华 为 的 存储 产品 出 厂 时 ，DeviceManager 管理 程序 已 集成 并 
加 载 在 存储 系统 中 ， 用 户 无 需 安装 ， 通 过 浏览 器 即 可 登录 并 使 用 。 

0ceanStor 设备 出 厂 的 时 候 都 有 默认 的 初始 IP 地 址 , 作为 管理 IP (Management IP)， 
其 中 ， 控 制 器 A 和 控制 器 B 的 默认 初始 IP 地 址 分 别 是 192. 168. 128. 101 和 192. 168; 
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128. 102, 默认 的 管理 端口 为 8088, 默认 的 登录 用 户 名 为 admin, 密码 为 Admin@storage。 

在 若 容 浏览 器 中 输入 : https://<management ip> :8088， 将 进入 DeviceManager 
登录 界面 (如 图 12-1 所 示 )， 在 登录 界面 输入 相应 的 用 户 名 和 密码 登录 后 ， 将 登入 管理 
主 界面 。 





大 0 OceanStor OriceMans. *% YR 


- Wpa/ /92.168.128.101:3068/deviceManager/devicemanager/featurefioginfiogin html © QB 安 | 自 易 仙 加 三 


a OceanStor DeviceManager 
ES admin 
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重病 wo 


Ee ee 
图 12-1 DeviceManager 登录 界面 


主 界面 划分 成 多 个 功能 区 ， 每 个 功能 区 分 别提 供 不 同 的 功能 。 

(1) 点 击 “ 系 统 ”， 可 以 进入 系统 功能 区 ， 用 户 可 以 查看 存储 系统 相关 硬件 信息 和 
状态 信息 ， 包 括 硬 盘 类 型 、 硬 盘 运 行 状态 、 电 源 / 风 肩 状 态 、 备 份 电池 BBU 状态 、 接 口 模 
块 状态 和 端口 详细 信息 等 。 

(2) 点 击 “ 资 源 分 配 "， 可 以 查看 存储 系统 相关 配置 信息 或 进行 存储 系统 配置 。 

(3) 点 击 “ 数 据 保护 ”可 以 查看 存储 系统 可 靠 性 配置 信息 或 进行 数据 保护 配置 。 
存储 系统 支持 多 种 数据 备份 和 容 灾 技术 ， 可 以 提升 部 件 失 效 时 的 数据 可 靠 性 ， 保 证 数据 
业务 顺利 、 安 全 运行 。 

(4) 点 击 “ 监 控 ”， 可 以 直观 地 了 解 各 个 监控 对 和 象 的 性 能 情况 ， 便 于 用 户 根 据 应 用 
程序 的 实际 服务 需求 来 及 时 调整 性 能 目标 ， 保 证 阵列 的 有 限 资源 能 够 分 配给 关键 业务 ; 
除了 监控 功能 ，DeviceManager 还 允许 用 户 通 过 告警 功能 及 时 发 现 并 处 理 故 障 。 简 言 之 ， 
用 户 可 以 监控 存储 系统 性 能 变化 ， 处 理 告警 和 事件 信息 ， 查 看 系统 功 耗 情况 等 。 

(5) 点 击 “ 设 置 "， 除 了 可 以 查看 存储 系统 的 基本 信息 ， 用 户 还 可 以 对 系统 配置 初 
始 化 、 对 设备 进行 重启 和 关机 ， 以 及 导出 系统 数据 等 。 

除了 文 持 上 述 简单 而 有 效 的 管理 功能 ， 存 储 阵 列 还 通过 在 控制 器 上 内 蔚 虚 拟 机 特 
性 ， 以 简化 部 署 流程 、 提 升 性 能 效用 和 降低 方案 成 本 。 
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当 存 储 设备 硬件 顺利 上 架 ， 并 正确 连接 所 有 线 绕 ， 此 时 ， 为 了 增加 系统 安全 性 ， 用 
户 往往 需要 重新 设置 设备 的 管理 TP、 用户 名 和 密码 。 

要 修改 设备 的 管理 IP 地 址 ， 首 先 用 串口 线 连接 到 控制 器 的 串口 (如 图 12-2 所 示 )， 
然后 利用 具有 串 行 通信 能 力 的 终端 程序 ， 对 每 个 控制 器 进行 设置 。 


一 一 串口 线 
一 一 -管理 网 线 





12-2 连接 串口 线 到 控制 器 


串 行 接口 终端 程序 有 很 多 ， 最 广为人知 的 则 是 PuTTY”。 当 使 用 终端 程序 PuTTY 连 
接 到 控制 器 时 , 选择 相应 的 串口 连接 类 型 , 输入 维护 终端 与 存储 设备 相连 的 串口 名 称 ( 如 
COM1)， 并 设置 波 特 率 为 115200。 

当 PuTTY 终端 和 控制 器 成 功 建立 连接 ， 可 使 用 系统 默认 的 用 户 名 和 密码 进行 登录 ， 
登录 成 功 后 , 将 显示 命令 行 提 示 符 admin:/>, 此 时 ,可 以 使 用 show system management_ip 
命令 查询 管理 网 口 的 相关 信息 ， 然 后 运行 change system management_ip 命令 分 别 修改 
控制 器 A 和 控制 器 B 管理 网 口 的 IP 地 址 。 修 改 完成 后 ， 需 要 通过 已 修改 的 管理 IP 地 址 
重新 登录 DeviceManager。 





通过 采用 块 虚拟 化 技术 对 硬盘 进行 管理 ，SAN 存储 系统 能 够 合理 调配 存储 资源 ， 为 
应 用 服务 器 提供 有 效 的 存储 空间 , 并 快速 响应 用 户 的 读 写 请 求 。 

实现 SAN 存储 业务 配置 要 经 过 以 下 步骤 〔〈 如 图 12-3 所 示 )。 

存储 池 是 存储 空间 资源 的 容器 ， 所 有 应 用 服务 器 使 用 的 存储 空间 都 来 自 于 存储 池 ， 
而 存储 池 的 存储 资源 来 自 于 硬盘 域 。 因 此 ， 首 先 需 要 创建 一 个 硬盘 域 ， 将 物理 硬盘 空间 


J 
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组 织 在 一 起 。 硬 盘 域 可 以 由 多 块 相同 或 不 同类 型 的 硬盘 组 合 而 成 ， 不 同 的 硬盘 域 相互 隔 
离 ， 如 果 将 不 同 的 业务 承载 到 不 同 硬盘 域 中 ， 可 以 达到 隔离 业务 之 间 性 能 影响 和 故障 影 
响 的 目的 。 





图 12-3 SAN 存储 业务 配置 


便 盘 域 的 硬盘 类 型 决定 了 存储 池 可 以 创建 的 存储 层级 ， 在 创建 时 需要 指定 构成 硬盘 
域 的 重 盘 类 型 和 数量 。 创 建 硬盘 域 时 ， 可 以 自动 或 手工 选择 硬盘 类 型 和 热 备 策略 。 高 性 
能 层 由 SSD 盘 组 成 ， 性 能 最 高 ; 性 能 层 由 SAS 盘 组 成 ， 性 能 较 高 ; 容量 层 由 NL-SAS 盘 组 
成 ， 性 能 最 低 。 当 只 选择 高 性 能 层 来 构建 硬盘 域 时 ， 硬 盘 数 量 最 少 为 4 盘 ， 当 不 只 选择 
高 性 能 层 时 ，SSD 盘 数 最 少 为 2 盘 ， 其 他 层 至 少 4 盘 。 

应 用 服务 器 使 用 的 存储 空间 来 自 于 存储 系统 的 存储 池 ， 存 储 池 从 硬盘 域 中 划分 出 
来 ， 每 个 硬盘 域 都 可 以 划分 成 一 个 或 多 个 存储 池 。 存 储 池 是 硬盘 域 中 一 个 或 多 个 存储 层 
的 逻辑 组 合 ， 不 同 存储 层 可 以 配置 不 同 的 RAID 策略 ，RAID 策略 包含 RAID 级 别 以 及 组 成 
RAID 级 别 的 数据 块 和 校 验 块 的 个 数 。 管 理 员 在 创建 存储 池 的 时 候 , 需要 考虑 后 续 创 建 LUN 
的 使 用 场景 。 

成 功 创建 存储 池 后 ， 存储 池 的 存储 空间 尚 不 能 被 主机 识别 。 只 有 将 存储 池 中 的 存 
储 空 间 划分 为 多 个 逻辑 单元 (LUN),， 并 将 LUN 映射 给 主机 后 ， 主 机 才能 使 用 分 配给 它 
的 存储 空间 。LUN 的 RAID 保护 策略 和 存储 池 相 同 。 在 存储 池 中 可 以 创建 Thick LUN 
和 Thin LUN。Thick LUN 的 特点 是 预先 从 存储 池 中 分 配 满 额 的 存储 容量 ， 即 使 Thick 
LUN 没有 存储 任何 用 户 数 据 ， 它 也 会 占用 Thick LUN 大 小 的 存储 空间 ; 而 Thin LUN 
不 会 预先 从 存储 池 中 分 配 满 额 的 存储 空间 ， 它 是 在 创建 时 预先 分 配 一 部 分 存储 空间 ， 
剩余 的 空间 根据 用 户 写 入 的 数据 量 从 存储 池 中 按 需 进行 分 配 。Thin LUN 相关 内 容 可 
参看 本 书 第 8 章 的 自动 精简 配置 技术 。 


= 一 :267 一 


数据 存储 技术 


为 了 便于 管理 ， 主 机 使 用 LUN 时 ， 必 须 将 LUN 加 入 到 LUN 组 中 。 一 个 LUN 组 可 以 包 
含 一 个 或 多 个 LUN， 同 一 个 LUN 也 能 添加 到 多 个 LUN 组 中 。 通 过 为 LUN 组 和 主机 组 建立 
映射 关系 ， 主 机 组 中 的 主机 就 能 使 用 LUN 组 中 的 LUN。 

为 了 建立 存储 设备 与 应 用 服务 器 的 连接 ， 需 要 先 在 存储 设备 上 创建 主机 ， 用 这 个 虚 
拟 的 主机 来 表示 远 端 的 应 用 服务 器 。 因 此 ， 要 为 主机 添加 启动 器 (Initiator)， 启 动 器 
号 是 远 端 物理 服务 器 的 唯一 标识 ， 通 过 给 主机 添加 对 应 的 启动 器 ， 才 能 建立 存储 虚拟 主 
机 和 物理 应 用 服务 器 的 对 应 关系 。 创 建 主机 时 可 以 设置 主机 的 基本 信息 ， 如 果 主 机 与 存 
储 之 间 通 过 iSCSI 链 路 连接 ， 建 议 输入 相关 描述 信息 ， 并 且 输 入 主机 真实 IP 地 址 ， 此 
IP 地 址 仅 用 于 标记 ， 便 于 管理 员 管 理 维护 ， 无 实际 意义 。 

主机 通过 增加 的 启动 器 来 访问 存储 资源 ， 若 主机 与 存储 通过 FC 链 路 连接 ， 启 动 器 
是 主机 的 HBA 卡 上 的 端口 ， 目 标 器 是 存储 设备 上 与 主机 传输 数据 的 端口 。 创 建 时 启动 器 
类 型 选择 FC， 需要 使 用 全 球 端口 名 (WWPN)， 启 动 器 的 WWPN 号 必须 与 应 用 服务 器 侧 的 启 
动 器 相同 。 如 果 是 FC 网 络 ， 则 DeviceManager 可 以 通过 自动 扫描 发 现 已 配置 的 启动 器 ， 
只 需 从 列表 中 选择 相应 的 启动 器 添加 即 可 。 

车 应 用 服务 器 与 存储 通过 iSCSI 链 路 连接 , 启动 器 类 型 选择 iSCSI, 需要 使 用 iSCSI 
合格 名 (iSCSI Qualified Name, IQN)。 如果 应 用 服务 器 与 存储 之 间 已 发 现 并 建立 了 iSCSI 
连接 ， 则 DeviceManager 会 自动 扫描 已 配置 的 启动 器 ， 无 需 再 进行 创建 ， 仅 需 从 列表 中 
选择 相应 的 启动 器 再 行 添 加 。 如 果 列 表 中 没有 可 用 的 启动 器 ， 则 需 手 动 进 行 创 建 。 

主机 的 IQN 必须 是 唯一 的 ， 但 应 用 服务 器 的 IQN 号 可 以 人 为 任意 更 改 。 当 存储 系统 
与 多 台 应 用 服务 器 建立 连接 时 ， 为 了 快速 定位 需要 添加 的 启动 器 ， 往 往 会 修改 启动 器 名 
称 ， 而 启动 器 名 称 的 重复 将 导致 应 用 服务 器 与 存储 系统 连接 失败 。 因 此 在 同一 个 网 络 中 ， 
管理 员 需 要 注意 避免 多 台 主 机 存在 IQN 冲突 问题 。 

同样 地 ， 为 了 使 主机 能 使 用 LUN， 需 将 主机 加 入 到 主机 组 中 。 一 个 主机 组 可 以 包含 
一 个 或 多 个 主机 ， 一 个 主机 也 可 以 添加 给 一 个 或 多 个 主机 组 。 通 过 为 LUN 组 和 主机 组 建 
立 映射 关系 ， 能 实现 主机 组 中 的 主机 使 用 LUN 组 中 的 LUN。 

创建 主机 组 时 ， 选 择 要 添加 到 主机 组 的 主机 ， 一 个 LUN 可 以 同时 映射 给 多 台 主 机 ， 
如 果 添 加 给 主机 组 的 多 个 主机 不 属于 同一 集群 ,可 能 导致 数据 访问 冲突 , 造成 数据 丢失 。 
因此 ， 若 将 LUN 映射 给 主机 ， 需 要 确保 主机 组 内 只 有 一 台 主 机 。 若 有 多 台 主 机 ， 在 执行 
该 操作 前 ， 确 保 主 机 安装 了 集群 软件 并 且 组 成 了 集群 ， 避 免 出 现 数据 丢失 问题 。 

建立 LUN 组 和 主机 组 的 映射 时 ， 也 可 以 选择 对 应 的 端口 组 。 端 口 组 是 个 可 选项 ， 它 
是 指 将 多 个 物理 端口 在 逻辑 上 创建 的 一 个 组 合 ， 存 储 系统 使 用 指定 端口 的 方式 建立 存储 
资源 和 服务 器 之 间 的 对 应 关系 。 通 过 创建 端口 组 并 将 其 加 入 到 映射 视图 ， 指 定 LUN 组 中 
的 LUN 与 主机 组 对 应 的 主机 就 能 使 用 特定 的 端口 进行 通信 。 和 否则 ， 存 储 系统 将 采用 随机 
分 配 的 可 用 端口 进行 通信 。 
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将 LUN 组 和 主机 组 通过 创建 映射 视图 的 方式 关联 起 来 ， 根 据 映射 视图 使 用 端口 的 不 
同 ， 可 以 将 映射 视图 分 为 主机 映射 和 端口 映射 。 主 机 映射 即 为 LUN Masking， 它 指 的 是 
LUN 与 主机 端口 的 WWPN 地 址 绑 定 (或 iqn 地 址 绑 定 )， 与 主机 端口 建立 一 对 一 或 多 对 一 
的 连接 和 访问 关系 。 无 论 主机 连接 存储 的 哪 一 个 端口 ， 主 机 都 能 识别 到 相同 的 LUN。 端 
口 映 射 即 为 LUN Mapping， 其 指 的 是 LUN 与 存储 设备 的 前 端 端口 进行 绑 定 ， 主 机 连接 不 
同 的 前 端 端口 时 所 能 访问 的 LUN 不 同 。 

完成 存储 侧 的 配置 ， 且 存储 系统 与 应 用 服务 器 建立 连接 后 ， 便 可 以 通过 在 应 用 服务 
器 上 执行 硬盘 扫描 操作 来 发 现 新 增 的 硬盘 ， 然 后 执行 格式 化 操作 ， 格 式 化 之 后 可 以 将 该 
LUN 对 应 的 存储 空间 视 为 普通 硬盘 ， 在 操作 系统 下 对 其 进行 读 / 写 操作 。 

一 般 物 理 主机 使 用 FC 或 者 iSCSI 协议 通过 交换 机 连接 到 存储 网 络 。 使 用 iSCSI 协 
议 ， 主 机 检测 新 LUN 的 方法 与 FC 协议 有 所 不 同 。 当 使 用 iSCSI 协议 映射 LUN 到 主机 时 ， 
首先 需要 使 用 iSCSI initiator 软件 将 LUN 连接 到 操作 系统 。 若 应 用 服务 器 与 存储 系统 
通信 正常 ， 则 可 以 建立 启动 器 与 目标 器 的 连接 , 建立 连接 后 ,可 以 道 过 iSCSI initiator 
软件 发 现 目标 的 状态 为 已 连接 ; 当 使 用 FC 协议 映射 LUN 到 主机 操作 系统 时 , 一 旦 创建 了 
映射 视图 ，LUN 就 立即 连接 到 了 操作 系统 。 不 管 是 基于 iSCSI 协议 ， 还 是 基于 FC 协议 ， 
连接 到 主机 操作 系统 的 LUN, 都 要 经 过 磁盘 管理 器 的 处 理 之 后 , Windows 操作 系统 才能 实 
现 对 LUN 的 数据 存 取 。 

新 映射 的 LUN 将 显示 在 磁盘 管理 器 中 〔 该 磁盘 尚未 初始 化 )， 对 新 增 的 逻辑 磁盘 进 
行 初始 化 ， 并 选择 磁盘 分 区 形式 ， 用 户 便 可 以 对 该 分 区 进行 高 级 格式 化 ， 即 创建 文件 系 
统 。 文 件 系 统 创建 完成 后 便 可 以 供 操 作 系 统 使 用 ， 运 行 在 主机 上 的 应 用 程序 可 以 选择 该 
卷 来 存储 数据 。 

Linux 操作 系统 主机 使 用 FC 或 者 iSCSI 协议 通过 交换 机 连接 到 存储 网 络 时 , 操作 系 
统 发 现 新 LUN 的 操作 与 Windows 操作 系统 不 同 。 以 RedHat 应 用 服务 器 为 例 。 

当 使 用 iSCSI 协议 映射 LUN 到 主机 时 ， 同 样 需要 先 使 用 iSCSI initiator 将 LUN 连 
接 到 操作 系统 。 

首先 运行 iscsiadm -m discovery -t st -~p《IP3》 命 令 添加 目标 器 ， 其 中 IP 为 存储 
系统 iSCSI 业务 网 口 地 址 ， 然 后 运行 iscsiadm -m node -1 命令 登录 目标 器 ， 并 可 通 
过 iscsiadm -m node 命令 查看 已 经 登录 的 目标 器 。 

当 Linux 服务 器 和 存储 设备 连接 并 登录 后 , 首先 运行 hot_add 命令 来 扫描 新 映射 
的 LUN。 

查看 服务 器 上 存储 分 配 过 来 的 LUN， 可 以 用 fdisk -1 命令 来 查看 新 的 逻辑 磁盘 。 
如 果 要 使 用 该 新 逻辑 磁盘 ， 需 要 对 磁盘 进行 分 区 并 格式 化 ， 然 后 再 挂 载 。 

运行 mount 挂 载 命令 ， 查 看 应 用 服务 器 上 扫描 到 的 硬盘 是 否 挂 载 成 功 ， 如 果 挂 载 成 
功 ， 则 应 用 服务 器 可 以 将 扫描 到 的 硬盘 作为 普通 硬盘 对 其 进行 读 / 写 操作 。 
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0ceanStor V3 存储 系统 提供 文件 级 访问 ， 支 持 应 用 服务 器 通过 NFS、CIFS、FTP 或 
者 HTTP 等 文件 访问 协议 来 访问 共享 文件 。 
实现 NAS 存储 业务 配置 要 经 过 以 下 步骤 (如 图 12-4 所 示 )。 









Windows 客 户 端 UNIX 客 户 端 


创建 存储 池 
创建 文件 系统 







创建 本 地 认证 用 户 


Windows 
直接 访问 


图 12-4 NAS 存储 业务 配置 


与 12. 3 节 相似 ， 首 先 需要 创建 硬盘 域 ， 然 后 创建 存储 池 ， 具 体 如 下 。 

硬盘 域 由 多 块 相同 或 不 同类 型 的 硬盘 组 合 而 成 ， 通 过 创建 硬盘 域 ， 将 物理 硬盘 空间 
组 织 在 一 起 。 不 同 的 硬盘 域 间 相 互 隔离 ， 可 以 利用 不 同 的 硬盘 域 承载 不 同 的 业务 ， 达 到 
隔离 业务 之 间 性 能 影响 和 故障 影响 的 效果 。 

存储 池 是 存储 空间 资源 的 容器 ， 所 有 应 用 服务 器 使 用 的 存储 空间 都 来 自 存储 池 ， 而 
存储 池 的 存储 资源 来 自 硬盘 域 。 硬 盘 域 的 硬盘 类 型 决定 了 存储 池 可 以 创建 的 存储 层级 ， 
例如 ， 高 性 能 层 由 SSD 盘 组 成 ， 性 能 最 高 ， 性 能 层 由 'SAS 盘 组 成 ， 性 能 较 高 ， 容 量 层 由 
NL-SAS 盘 组 成 ， 性 能 最 低 。 

文件 系统 在 存储 池 之 上 创建 ， 因 此 ， 要 先 选择 用 于 提供 文件 存储 服务 的 存储 池 ， 
然后 再 创建 文件 系统 , 通过 创建 存储 系统 可 以 使 存储 系统 以 文件 目录 的 形式 共享 存储 
资源 。 

在 创建 共享 前 , 需要 先 创建 逻辑 端口 ,V3 存储 系统 是 基于 逻辑 端口 来 承载 文件 业务 。 
逻辑 端口 可 以 基于 物理 以 太 网 端口 来 创建 , 也 可 以 通过 绑 定 端口 或 采用 VLAN 来 创建 。 基 
于 物理 端口 创建 逻辑 端口 时 ,该 物理 端口 不 能 预先 有 IP 地 址 , 否则 将 无 法 创建 逻辑 端口 。 
启用 IP 地 址 漂移 后 ， 如 果 主 用 端口 失效 ， 业务 会 默认 被 漂移 组 内 其 他 可 用 端口 接管 ， 整 
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个 过 程 中 业务 使 用 的 IP 地 址 不 变 。 因 此 ,逻辑 端口 能 够 在 不 中 断 主机 业务 的 情况 下 ， 快 
速 将 故障 端口 的 业务 切换 至 其 他 同 种 类 型 的 可 用 端口 。 当 故障 端口 恢复 正常 工作 后 ， 又 
可 重新 接管 业务 ， 从 而 保障 业务 的 连续 性 。 

创建 共享 时 ， 需 要 关联 可 访问 该 共享 的 用 户 。 若 认证 方式 为 本 地 认证 ， 还 需要 创建 
本 地 认证 用 户 。 即 在 本 地 认证 的 应 用 中 ， 本 地 用 户 用 于 访问 共享 。 

文件 系统 只 有 被 共享 后 , 用 户 才能 访问 该 文件 系统 ,文件 系统 的 共享 方式 主要 包括 : 
NFS 共享 、CIFS 共享 、FTP 共享 和 HTTP 共享 。 

CIFS (Common Internet File System) 是 微软 公司 开发 的 文件 共享 协议 ， 主 要 应 
用 于 Windows 操作 系统 环境 下 的 文件 系统 共享 。CIFS 共享 将 文件 系统 共享 给 通过 认证 的 
用 户 ， 包 括 本 地 认证 用 户 和 域 认 证 用 户 ， 用 户 对 CIFS 共享 拥有 相应 的 权限 。 

NFS (Network File System) 是 SUN 公司 开发 的 网 络 文件 系统 ， 主 要 应 用 于 Linux、 
UNIX、Mac 0S 和 VMware 操作 系统 环境 的 文件 系统 共享 。 需 要 说 明 的 是 ， 当 Linux/UNIX 
客户 端 通过 NFS 访问 共享 文件 系统 时 ， 需 要 执行 文件 系统 挂 载 操作 。 

FTP (File Transfer Protocol) 是 TCP/IP 网 络 上 两 台 计 算 机 之 间 的 文件 传输 协议 ， 
主要 应 用 于 Internet 环境 。 

HTTP (Hypertext Transfer Protocol) 是 用 于 从 WWW (World Wide Web) 服务 器 传 
答 超 文本 到 本 地 浏览 器 的 传送 协议 ， 主 要 应 用 于 Internet 环境 。 

当 文件 系统 以 各 种 方式 共享 后 ， 用 户 便 可 以 访问 该 共享 的 存储 空间 。 
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1. 日 常 维护 

存储 系统 在 运行 一 段 时 间 后 ， 往 往 会 出 现 一 些 意 外 或 不 可 控 的 故障 问题 。 

当 故 障 发 生 时 ， 请 注意 收集 后 续 故 障 处 理 所 需 的 相关 信息 ， 以 便 更 好 、 更 快 地 定位 
故障 发 生 的 原因 ， 进 而 排除 故障 。 

故障 处 理 流 程 如 图 12-5 所 示 ， 利 用 该 流程 ， 可 以 对 产品 使 用 过 程 中 出 现 的 故障 进 
行 排除 。 

故障 排查 时 ， 观 察 并 记录 指示 灯 的 状态 ， 通 过 指示 灯 的 状态 初步 判断 发 生 故 障 的 
模块 。 

指示 灯 工 作 状 态 所 代表 的 含义 见 表 12-1: 

登录 DeviceManager 管理 界面 ， 可 以 查询 存储 设备 的 运行 状态 ， 并 碍 看 是 否 有 告警 
或 事件 消息 。 

如 果 在 DeviceManager 管理 界面 中 查询 到 告警 或 事件 信息 ， 则 根据 DeviceManager 
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数据 存储 技术 


管理 界面 提供 的 处 理 建议 进行 处 理 。 






观察 并 记录 指示 灯 状 态 


ee 否 参见 “无 法 登录 DeviceManager 
管理 界面 ? 管理 界面 ”进行 故障 排除 
是 
查看 系统 是 否 ? 
有 事件 消息 ? 
是 


根据 事件 处 理 建议 处 理事 件 














观察 故障 现象 并 分 析 
定位 故障 产生 的 原因 
根据 定位 出 的 原因 进行 故障 排查 


故障 是 否 排除 ? 
i 收集 故障 信息 
联系 技术 支持 工程 师 


图 12-5 故障 处 置 流程 













故障 是 否 排除 ? 






表 12-1 指示 灯 状 态 及 其 含义 
z 
模块 正常 、 端 口 的 速率 值 
模块 故障 
模块 正在 启动 、 定 位 端口 、 定 位 硬盘 


绿灯 内 端口 正在 传输 数据 、BBU 充电 、 电 源 模 抉 已 接 、 硬 盘 传 输 数 据 电 源 但 未 上 电 、 
控制 器 正在 启动 、 端 口 模块 有 热 拔 插 请 求 








端口 的 速率 值 
端口 正在 传输 数据 
管理 网 口 正 在 传输 数据 、BBU 正在 放电 


灯 不 亮 未 上 电 、 未 连 线 、 端 口 模块 可 以 拔 插 、 告 警 灯 灭 表示 正常 、16B 的 iSCSI 主机 
Se 端口 的 速率 灯 灭 表示 速率 低 于 IGB 








在 进行 故障 分 析 处 置 时 , 遵循 如 下 故障 定位 基本 原则 , 帮助 用 户 快速 排除 无 效 信 息 ， 
实现 对 故障 的 迅速 定位 。 
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故障 处 理 过 程 中 应 该 遵循 以 下 基本 原则 。 

(1) 先 定位 外 部 ， 后 定位 内 部 。 在 进行 系统 的 故障 定位 时 ， 应 该 首先 排除 外 部 设备 
的 问题 。 外 部 设备 问题 包括 光纤 、 光 缆 、 客 户 设备 等 存在 的 问题 ;内 部 问题 包括 硬盘 、 
控制 器 、 接 口 模块 等 故障 问题 。 

(2) 先 分 析 高 级 别 告警 信息 ， 后 分 析 低 级 别 告警 信息 。 在 分 析 告 警 时 ， 应 该 按照 级 
别 的 优先 级 依次 进行 分 析 ， 如 先 分 析 紧 急 级 别 的 告警 ， 再 分 析 重 要 和 警告 级 别 的 告警 。 

(3) 先 分 析 共 性 告警 ， 后 分 析 个 别 告警 。 在 分 析 告 警 时 ， 应 先 分 析 是 个 别 问题 还 是 
共性 问题 ， 确 定 问题 的 影响 范围 。 需 要 确定 是 一 个 模块 出 问题 ， 还 是 多 个 模块 出 现 类 似 
问题 。 

如 果 在 DeviceManager 管理 界面 中 未 查询 到 告警 或 事件 信息 , 则 可 以 进行 信息 收集 。 
通过 及 时 收集 基础 信息 、 存 储 设备 信息 、 组 网 以 及 应 用 服务 器 信息 ， 可 以 帮助 维护 人 员 
更 快速 地 定位 故障 原因 并 排除 故障 。 主 要 信息 收集 项 目 见 表 12-2。 

表 12-2 信息 收集 项 目 

信息 类 型 
大 发生 
详细 记录 从 系统 正常 运行 到 故障 发 生前 执行 的 操作 
ne 详细 记录 从 故障 发 生 后 到 向 维护 人 员 上 报 故障 前 执行 的 操作 
故障 前 执行 的 操作 | 确认 在 故障 发 生前 DeviceManager 工作 是 否 正 常 
| 故障 后 执行 的 操作 详细 记录 从 故障 发 生 后 到 向 维护 人 员 上 报 故 障 前 执行 的 操作 
硬件 模块 配置 详细 记录 存储 设备 硬件 模块 的 配置 信息 
ER 记录 存储 设备 指示 灯 状 态 ， 尤 其 需要 记录 橙色 和 红色 状态 的 指 
指示 杂 状态 示 灯 信 息 
导出 存储 设备 的 配置 数据 。 导 出 的 配置 数据 文件 类 型 为 *. DAT， 
配置 数据 配置 数据 文件 包含 存储 系统 RAID 组 、LUN 映射 、 便 盘 和 FC 主机 
端口 速率 等 信息 
导出 存储 设备 的 运行 数据 。 导 出 的 运行 数据 文件 类 型 为 txt， 运 行 
数据 文件 包含 在 DeviceManager 上 配置 的 Email 和 电话 号 码 等 数据 


基础 信息 

















运行 数据 


存储 设备 
信息 导出 存储 设备 的 硬盘 上 日志。 导出 的 硬盘 卓志 文件 类 型 为 & tar， 

硬盘 日 志 | 硬盘 日 志文 件 包含 存储 系统 根据 默认 的 硬盘 信息 采集 策略 周期 
内 采集 到 的 所 有 数据 








导出 存储 设备 的 系统 日 志 。 导出 的 系统 日 志文 件 类 型 为 *. tar， 
系统 日 志 系统 日 志文 件 包含 存储 系统 上 的 运行 数据 、 事 件 信息 和 调试 
日 志 
导出 存储 设备 的 事件 信息 。 导 出 的 事件 信息 文件 类 型 为 *. csv， 
事件 信息 事件 信息 文件 包含 根据 设备 名 称 、 事 件 来 源 、 级 别 和 输入 关键 
字 等 信息 筛选 出 的 事件 
描述 应 用 服务 器 与 存储 设备 间 的 网 络 连接 方式 ， 如 FC 组 网 、 
类 央 二 入 iSCSI 组 网 等 
RA 交换 机 型 号 如 果 网 络 中 存在 交换 机 ， 请 记录 交换 机 的 型 号 

网 络 拓扑 结构 描述 应 用 服务 器 与 存储 设备 间 的 网 络 拓扑 结构 或 提供 组 网 图 
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( 续 表 ) 


如 果 应 用 服务 器 与 存储 设备 间 采 用 iSCSI 组 网 , 需要 描述 IP 地 
址 划分 原则 或 提供 IP 地 址 分 配 列 表 

操作 系统 版 本 记录 应 用 服务 器 中 安装 的 操作 系统 类 型 和 版 本 号 

端口 速率 如 果 应 用 服务 器 与 存储 设备 间 采 用 FC 组 网 , 请 记录 与 存储 设备 
| 相连 的 应 用 服务 器 端口 速率 

操作 系统 日 志 查看 并 导出 操作 系统 日 志 信息 


存储 侧 信 息 收 集 时 ， 在 DeviceManager 界面 ， 点 击 “ 设 置 "， 可 以 在 “任务 ”区 域 
点 击 导 出 数据 ， 从 而 导出 存储 设备 的 运行 数据 、 系 统 日 志和 硬盘 日 志 (如 图 12-6 所 示 )。 


组 网 信息 IP 地 址 信息 


应 用 服务 器 
信息 





导出 数据 x 
| 运行 数据 
| 说 设 备 当 前 的 运行 状态 数 据 ， 反映 了 实时 的 和 天 要 关注 的 没 备 运行 数据 和 状 
一 一 
四 了 珊 
IE 系统 B 志 
三 | 设 各 上 的 运行 烧 据 事件 信息 和 洒 二 日 志 等 信息 , 可 用 于 分 析 设 备 的 运行 
一 状态 收集 和 导出 此 信息 棕 寿 近 几 分 如。 
近期 日 志 S 
从 日 志 列表 
本 癌 1 硬盘 日 志 
| 上 | 硬 本 的 日 志 信 息 ， 可 用 于 分 析 弄 鱼 的 状 志 ， 直 位 问题 ， 
从 DHA 运 行 日 志 列 表 
人 9 HssD 日 志 列 表 
关闭 帮助 


图 12-6 导出 数据 


2. 常用 维护 软件 

0ceanStor ToolKit 是 由 华为 技术 有 限 公司 开发 的 管理 工具 包 ， 通 过 该 工具 包 可 以 
帮助 技术 服务 工程 师 、 运 维 工程 师 对 设备 进行 部 署 、 维 护 和 升级 。 

“工具 Store” 提 供 独立 安装 、 部 署 、 维 护 、 升 级 等 功能 。 可 以 通过 “工具 Store” 
进行 安装 、 务 载 或 升级 等 操作 〈 如 图 12-7 所 示 )。 在 第 一 次 安装 0ceanStor Toolkit 工 
有 具 箱 后 ， 需 要 输入 用 户 名 和 密码 进行 身份 验证 ， 以 此 来 激活 “工具 Store”。 此 外 ， 可 以 
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通过 “工具 Store” 将 已 安装 的 工具 导出 到 本 地 或 将 本 地 下 载 好 的 工具 导入 到 “工具 


Store” 中 。 


A OceanStor Toolkit 


OceanStor Toolkit 


宇 部 工 是 (841 - A 导 ， ta) 情 姑 机 让 雪上 这 有 和 于 
存续 【19124)} 
云 计 基 CT 
夺 乞 车 (7) 
文 热 检 /09) 
太 赣 抬 0m) 


其 好 [11 


硬盘 升 绍 
闭 帆 立 元 饼 硬 合 固 件 损 本 


旭 级 检 而 
坟 认 正确 演 搞 管理 F3 坟 ， 


硬盘 开局 再 出 
机 贱 念 在 开局 6 反 要 盘 进 


琢 新 栈 本 100109021 


当前 任务 ; 共有 01 
| 对 助 合 在 开 是 8 对 硬盘 进行 扫 振 相 i 胃 出， 及 时 发 珊 风 则 谭 
登 ， 并 策 好 知 件 价 搞 。 保障 后 终 站 盘 的 各 定 运行 * 只 彰 绞 





图 12-7 0ceanStor Toolkit 界面 


部 署 功 能 可 以 帮助 技术 服务 工程 师 、 运 维 工 程 师 进行 设备 初始 化 。 

维护 功能 可 以 帮助 技术 服务 工程 师 、 运 维 工程 师 对 设备 进行 日 常 检 查 、 信 息 收 集 等 
操作 。 

和 级 功能 可 以 帮助 技术 服务 工程 师 、 运 维 工程 师 对 设备 进行 在 线 或 离线 升级 。 

进行 在 线 升 级 时 ， 在 升级 前 需要 确保 升级 包 版 本 支持 从 当前 版 本 在 线 升 级 到 升级 包 
版 本 。 在 线 升 级 时 ， 系 统 首先 升级 备用 控制 器 〈 备 控 ) 软件 ， 再 升级 主 控制 器 〈 主 控 ) 
软件 。 升 级 备用 控制 器 时 ， 首 先 将 备 控 的 业务 切换 到 主 控 ， 然后 自动 检查 需要 升级 的 固 
件 并 依次 进行 升级 ， 升 级 完成 后 重新 启动 备 控 系统 ， 等 备 控 系统 重新 恢复 上 电 后 ， 归 属 
于 备 控 的 业务 切换 回 备 控 ， 并 将 原 主 控 的 业务 切换 到 备 控 。 主 控 软 件 的 升级 采用 相同 的 
方式 

离线 升级 模式 下 ， 主 控 和 备 控 可 以 同时 进行 升级 ， 大 大 缩短 了 升级 时 间 。 由 于 升级 
之 前 已 经 中 止 主机 业务 读 写 ， 这 样 就 降低 了 系统 在 升级 过 程 中 出 现 数据 丢失 、 业 务 中 断 
的 风险 。 

随 着 华为 存储 产品 的 大 规模 交付 使 用 ， 用 户 对 提升 故障 处 理 效 率 的 需求 也 越 来 越 强 
烈 。 传 统 的 服务 支持 方式 为 全 人 工本 地 服务 ， 在 故障 发 现 环 节 ， 技 术 服 务 人 员 面 临 着 故 
障 发 现 不 及 时 、 信 息 传递 不 到 位 的 挑战 (如 图 12-8 所 示 )。 当 设备 出 现 故障 时 ， 如 何 及 
时 将 设备 故障 信息 回 传 到 技术 支持 中 心 ， 缩 短 故障 发 现时 间 是 企业 当前 的 迫切 需求 。 
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电话 / 短信 | 
10 分 钟 
客户 数据 中 心 


根据 具体 情况 总 部 服务 专家 






人 工 巡 视 电话 报修 电话 / 短信 
a 25 分 钟 让 10 分 钟 


存储 产品 ”管理 机 IT 管理 员 话音 服务 本 地 服务 人 员 


图 12-8 传统 故障 报修 过 程 


为 了 提升 故障 处 理 效率 ， 设 备 厂商 相继 推出 了 具备 告警 上 报 、 上 日 志 上 传 和 远程 接 入 
功能 的 专业 服务 工具 。 以 华为 的 云端 CloudService 为 例 , 它 支持 设备 故障 告警 信息 的 自 
动 回 传 以 及 帮助 故障 的 快速 恢复 。 当 设备 出 现 故障 时 ，CloudService 提供 的 告警 上 报 功 
能 能 够 及 时 将 设备 故障 信息 回 传 到 技术 支持 中 心 ， 大 大 缩短 了 故障 发 现时 间 。 

简 言 之 ，CloudService 具有 主动 健康 检查 、 告 警 即 时 感知 、 自 动 故 障 上 报 、 故 障 信 
息 即 时 回 传 等 功能 ， 发 生 故 障 后 将 自动 采集 故障 信息 并 上 报 ， 将 故障 报修 时 间 缩 短 至 几 
分 钟 ( 如 图 12-9 所 示 )。 





Email \ SMS 


Email | SMS 


<30s <=30s 


1 和 


图 12-9 CloudService 故障 报修 过 程 





12.6 ”本章 小 结 


本 章 简 单 概述 了 存储 管理 软件 DeviceManager 的 基本 功能 与 操作 ， 重 点 介绍 了 SAN 
和 NAS 存储 业务 配置 以 及 存储 基本 运 维 管理 方法 。 通 过 块 虚拟 化 技术 ，SAN 存储 能 够 合 
理 调配 存储 资源 ， 灵 活 地 为 应 用 服务 器 提供 存储 空间 ; 利用 文件 级 访问 ，NAS 存储 能 够 
跨 平 台 访 问 存储 资源 ， 并 支持 多 种 文件 访问 协议 来 实现 存储 共享 。 借 助 管理 平台 软件 
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DeviceManager 和 管理 工具 包 0ceanStor ToolKit, 技术 工程 师 和 运 维 工程 师 不 仅 能 够 定 
位 并 排除 故障 ， 而 且 可 以 对 设备 进行 部 署 、 维 护 和 升级 。 


一 、 选 择 题 

1. SAN 存储 业务 配置 过 程 中 ， 创 建 硬盘 域 时 ， 一 个 硬盘 域内 最 小 硬盘 数 为 多 少 
( ) | 
.8 者 也. 4 六 & 只 D. 6 盘 

2. SAN 存储 业务 配置 过 程 中 ， 在 创建 主机 时 ， 在 “设置 主机 信息 ”中 ， 输 入 IP 地 
址 的 意义 是 ) 

A. 用 于 设备 之 间 通 信 

B. 用 于 标识 设备 ， 便 于 管理 员 管理 ， 无 实际 意义 

C. 此 IP 必须 是 存储 iSCSI 口 的 地 址 

D. 此 IP 必须 是 主机 网 口 地 址 

3. NAS 存储 业务 配置 过 程 中 ， 做 NFS 共享 ， 是 否 需 要 创建 本 地 认证 用 户 ， 并 配置 用 
户 名 密码 ( ) 


A. 需要 B， 不 需要 

4. 以 下 不 是 故障 处 置 的 基本 原则 的 是 〈 ) 

A.， 先 外 部 后 内 部 B， 先 高 级 后 低级 

C， 先 共性 后 个 别 D. 先 告 警 后 事件 

5，Toolkit 工具 的 主要 功能 有 哪些 ( ) 

A. 部署 B. 维护 C. 信息 收集 D. 升级 
二 、 简 答题 


假设 你 是 存储 运 维 工程 师 ， 某 天 接 到 用 户 电话 ,用 户 告诉 你 ,存储 出 现 了 性 能 问题 ， 
导致 业务 访问 性 能 下 降 。 请 问 ， 你 该 如 何 排查 解决 该 故障 ? 


I 











SNIA (Storage Networking Industrial Association); 成 员 来 自 存储 厂 商 的 行业 
协会 组 织 ， 宗 旨 是 领导 全 世界 范围 的 存储 行业 开发 、 推 广 标准 、 技 术 和 培训 服务 ， 已 成 
为 存储 行业 的 领导 组 织 ， 拥 有 420 多 家 来 自 世 界 各 地 的 公司 成 员 ， 遍 及 整个 存储 行业 。 

ILM (Information Lifecycle Management): 指 从 一 个 信息 系统 数据 及 其 相关 元 数 
据 产 生 和 初始 储存 阶段 到 最 后 过 时 被 删除 时 的 一 套 综合 管理 方法 。 信 息 生 命 周 期 管理 技 
术 根据 用 户 的 操作 从 全 方位 对 数据 进行 管理 ， 它 可 以 根据 各 项 数据 标准 自动 把 数据 归 到 
各 层 ， 并 且 自 动 完成 数据 在 各 层 之 间 的 移动 。 

CIA (Confidentiality，Integrity，and Availability): 指数 据 安全 性 的 三 个 方面 : 
机 密 性 , 完整 性 和 可 用 性 。 密 文 技 术 主 要 是 针对 机 密 性 和 完整 性 ， 防 算 改 技术 能 保证 数据 的 
完整 性 ， 备 份 技术 能 增强 数据 的 可 用 性 和 完整 性 ， 宛 你 技术 能 提供 更 好 的 可 用 性 。 





POSIX (Portable Operating System Interface of UNIX): 表示 可 移植 操作 系统 
接口 标准 。POSIX 标准 定义 了 操作 系统 应 该 为 应 用 程序 提供 的 接口 标准 ， 是 IEEE 为 要 在 
各 种 UNIX-1ike 操作 系统 上 运行 的 软件 而 定义 的 一 系列 API 标准 的 总 称 。 

Partition: 分 区 是 物理 磁盘 上 的 一 个 物理 分 隔 单元 。 基 本 磁盘 上 ， 分 区 被 称 为 基 
本 卷 ， 它 包含 主 分 区 和 扩展 分 区 ; 在 动态 磁盘 上 ， 分 区 被 称 为 动态 卷 ， 它 包含 简单 卷 、 
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术语 表 





带 区 卷 、 跨 区 卷 、 镜 像 卷 和 RAID-5 卷 。 

0S (0perating System): 管理 和 控制 计算 机 硬件 与 软件 资源 的 计算 机 程序 ， 是 计 
算 机 系统 中 负责 支撑 应 用 程序 运行 环境 及 用 户 操 作 环 境 的 系统 软件 ， 知 名 操作 系统 有 
Windows、Mac 0S、Linux 等 。 

I/0《Input/0utput): 即 输 入 /输出 端口 。 | 每 个 设备 都 会 有 一 个 专用 的 I/0 地 址 ， 
用 来 处 理 自己 的 输入 输出 信息 。CPU 与 外 部 设备 、 存 储 器 的 连接 和 数据 交换 都 需要 通过 
接口 设备 来 实现 。 

CRC (Cyclic Redundancy Check): 是 一 种 根据 网 络 数据 包 或 电脑 文件 等 数据 产生 
简短 固定 位 数 校 验 码 的 一 种 散 列 函 数 ， 主 要 用 来 检测 或 校 验 数 据 传输 或 者 保存 后 可 能 出 
现 的 错误 。 它 利用 除法 及 余数 的 原理 来 进行 错误 侦 测 。 

SCSI (Small Computer System Interface): 一 种 用 于 计算 机 和 和 智能 设备 之 间 〔( 硬 
盘 、 软 驱 、 光 驱 、 打 印 机 、 扫 描 仪 等 ) 系统 级 接口 的 独立 处 理 器 标准 。 SCSI 是 一 种 智 
能 的 通用 接口 标准 ， 在 SCSI 母线 上 可 以 连接 主机 适配器 和 八 个 SCSI 外 设 控制 器 。SCSI 
是 个 多 任务 接口 ， 设 有 母线 仲裁 功能 ， 挂 在 一 个 SCSI 母线 上 的 多 个 外 设 可 以 同时 工作 。 


第 3 章 存储 技术 和 组 网 


MAC (Media Access Control): 表示 互联 网 上 每 一 个 站 点 的 标识 符 ， 采 用 十 六 进 制 
数 表 示 ， 共 六 个 字 节 (48 位 )。MAC 地 址 实际 上 就 是 适配器 地 址 ， 具 有 全 球 唯一 性 。 

BBU (Battery Backup Unit): 借助 电池 备份 单元 ， 能 够 在 系统 外 部 供电 失效 的 情 
况 下 ， 提 供 后 备 电源 支持 ， 以 保证 存储 系统 中 业务 数据 的 安全 性 。 

AA (Active Active): 指 存储 阵列 中 两 个 控制 器 都 处 于 激活 状态 ， 可 并 行 处 理 来 自 
应 用 服务 器 的 IV0 请求， 一 旦 某 个 控制 器 出 现 故 障 或 离线 ， 男 一 个 控制 器 将 及 时 接管 其 
工作 ， 且 不 影响 自己 现 有 的 任务 。 

AP (Active Passive): 指 阵列 中 两 个 控制 器 中 只 有 一 个 控制 器 处 于 激活 状态 ， 作 
为 主 控制 器 ， 用 于 处 理应 用 服务 器 的 IZ0 请 求 ， 当 主 控制 器 出 现 故障 或 者 处 于 离线 状态 
时 ， 另 外 一 个 处 于 空闲 状态 的 控制 器 处 接管 其 工作 。 





第 4 章 传统 磁盘 驱动 器 的 读 写 技术 
LUN (Logical Unit Number): 磁盘 阵列 中 每 个 设备 都 可 以 看 作 逻 辑 单元 ， 每 个 都 
分 配 有 用 于 识别 SCSI 控制 命令 过 程 的 唯一 识别 号 ， 即 ， 巡 辑 单元 号 。 服 务 器 可 以 直接 与 
磁盘 阵列 连接 在 一 起 ， 也 可 以 通过 交换 设备 与 之 相连 。 一 旦 服务 器 和 磁盘 阵列 的 LUN 连 
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接 上 ， 就 可 以 通过 当前 的 网 络 接口 将 数据 传输 到 磁盘 阵列 上 

Hot spare: 热 备 盘 指 上 电 却 未 使 用 的 空闲 盘 ， 在 RAID 中 ， 它 指 代 一 个 正常 的 可 以 
用 来 顶替 RAID 组 失效 磁盘 的 备用 磁盘 。 

RAID (Redundant Arrays of Independent Disks): 由 多 个 价格 较 便 宜 的 磁盘 组 
合成 一 个 容量 巨大 的 磁盘 组 ， 其 利用 数据 分 片 技 术 将 数据 分 布 到 多 个 磁盘 上 ， 提 高 了 
数据 访问 并 行 性 ， 提 升 整个 磁盘 系统 效能 ;， 同 时， 通过 存放 宛 余 数据 也 增加 了 容错 能 
力 ， 按 照 数据 分 片 大 小 、 校 验 存放 方式 和 校 验 生 成 方法 ， 其 分 成 多 个 RAID 级 别 。 

JBOD (Just a Bunch 0f Disks): 在 一 个 底部 上 安装 多 个 磁盘 驱动 器 的 一 种 存储 设 
备 。 和 RAID 阵列 不 同 ，JBOD 没有 前 端 逻 辑 来 管理 磁盘 上 数据 分 布 ， 每 个 磁盘 都 进行 单 
独 寻 址 ， 作 为 独立 的 存储 资源 而 存在 。 

Parity Parity 指 校 验 数据 。 在 RAID 中 ， 它 是 从 两 个 或 更 多 原始 数据 产生 的 一 个 元 
余数 据 ， 用 于 RAID 的 2、3、4、5 级 别 中 。 
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USB (Universal Serial Bus): 是 一 个 外 部 总 线 标准 ， 用 于 规范 电脑 与 外 部 设备 的 
连接 和 通讯 。USB 是 PC 领域 的 常用 接口 ， 支 持 设备 的 即 插 即 用 和 热 插 拔 功 能 。 

DAS (Direct Attached Storage): 是 一 种 将 存储 设备 通过 连接 电缆 直接 连接 到 主 
机 服务 器 上 的 一 种 存储 方式 ,数据 存储 设备 采用 SCSI 或 FC 协议 直接 连接 在 内 部 总 线 上 ， 
构成 整个 服务 器 结构 的 一 部 分 。 

iSCSI (Internet Small Computer System Interface): 一 种 基于 TCP/IP 的 SCSI 指 
令 传输 协议 ， 用 来 建立 和 管理 IP 存储 设备 、 主 机 和 客户 机 等 之 间 的 相互 连接 ， 并 创建 存储 
区 域 网 络 (SAN)。 借 助 该 协议 ， 可 以 在 IP 网 络 上 传输 SCSI 指令 集 ， 即 ， 使 用 IP 网 络 访问 
远程 存储 设备 。 它 采用 C/S 模型 ，Initiator 为 客户 端 ，Target 为 存储 设备 端 。 


第 7 章 ， SAN 技术 介绍 


0SI (0pen System Interconnect): 是 国际 标准 化 组 织 制定 的 计算 机 互联 标准 ， 描 
述 了 计算 机 网 络 通信 的 基本 框架 。0SI 模型 把 网 络 通信 的 工作 分 为 7 层 ， 分 别 是 物理 层 、 
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数据 链 路 层 、 网 络 层 、 传 输 层 、 会 话 层 、 表 示 层 和 应 用 层 。 

FCoE (Fibre Channel over Ethernet): 是 一 种 以 光纤 通道 FC 存储 协议 为 核心 的 
I/0 整合 方案 ， 它 将 FC 帧 封装 到 以 太 网 帧 中 ， 以 实现 直接 在 增强 型 无 损 以 太 网 基础 设施 
上 传输 光纤 信道 信号 的 功能 。 

WAN (Wide Area Network): 通常 指 跨 接 很 大 物理 范围 的 网 络 ， 所 履 盖 的 范围 从 几 
十 公里 到 几 千 公里 ， 它 能 连接 多 个 城市 或 国家 ， 或 横 跨 几 个 洲 并 能 提供 远 距 离 通信 ， 形 
成 国际 性 的 远程 网 络 。 

IP 《Internet Protocol): 为 计算 机 网 络 相 互 连 接 进行 通信 而 设计 的 协议 。 在 
Internet 中 ， 它 是 能 使 连接 到 网 上 的 所 有 计算 机 网 络 实现 相互 通信 的 一 套 规则 ， 规 定 了 
计算 机 在 因特网 上 进行 通信 时 应 当 遵守 的 规则 。 任 何 厂 家 生产 的 计算 机 系统 ， 只 要 遵守 
该 协议 就 可 以 与 因特网 互 连 互通 。 

HBA (Host Bus Adapter): 一 种 能 插入 计算 机 、 服 务 器 或 大 型 主机 的 板 卡 或 集成 电 
路 适配器 ， 在 服务 器 和 存储 设备 之 间 提 供 1/0 处 理 和 物理 连接 。 光 纤 通 道 的 主机 总 线 适 
配器 卡 是 将 主机 接 入 FC 网 络 必 不 可 少 的 设备 。 

Gateway: 一 种 在 网 络 层 之 上 失效 网 络 互联 的 连接 器 ， 既 可 以 用 于 广域网 互 连 ， 也 可 以 
用 于 局 域 网 互 连 。 另 外 ， 网 关 又 称 为 协议 转换 器 ， 用 于 两 个 高 层 协议 不 同 的 网 络 互 连 。 

SAN (Storage Area Network): 一 种 专门 为 存储 建立 的 独立 于 TCP/IP 网 络 之 外 的 
专用 网 络 。 通 常 采用 网 状 通道 (Fibre Channel) 技术 ， 通 过 FC 交换 机 连接 存储 阵列 和 
服务 器 主机 ， 建 立 专用 于 数据 存储 的 区 域 网 络 。 由 于 SAN 网 络 独立 于 数据 网 络 存在 ， 因 
此 存 取 速 度 很 快 ， 另 外 ，SAN 一 般 采 用 高 端的 RAID 阵列 ， 通 常用 于 企业 级 存储 。 目 前 常 
见 的 SAN 有 FC SAN 和 IP SAN， 其 中 FC SAN 为 通过 光纤 通道 协议 转发 SCSI 协议 ，IP SAN 
通过 TCP 协议 转发 SCSI 协议 。 

Ethernet: 由 Xerox 公司 创建 的 基带 局 域 网 规范 ， 是 现 有 局 域 网 采用 的 最 通用 的 通 
信 协 议 标准 。 它 使 用 CSMA/CD 载波 监听 多 路 访问 及 冲突 检测 ) 技术 ， 包 括 包括 标准 以 
太 网 (10Mbit/s)、 快速 以 太 网 (100Mbit/s) 和 高 速 以 太 网 (1Gbit/s 和 10Gbit/s)， 它 
们 都 符合 IEEE802. 3 标准 。 

WWN (World Wide Name): 指 全 球 唯一 名 字 ， 通 常 是 由 权威 的 组 织 分 配 的 唯一 的 48 
位 或 64 位 数字 ， 以 区 分 一 个 或 一 组 网 络 连接 ， 用 来 标识 网 络 上 的 一 个 连接 或 连接 集合 ， 
主要 用 于 FC。 

QoS (Quality of Service): 指 一 个 网 络 利用 各 种 基础 技术 ， 为 指定 的 网 络 通信 提供 更 
好 的 服务 能 力 。QoS 是 网 络 的 一 种 安全 机 制 ， 是 用 来 解决 网 络 延迟 和 阻塞 等 问题 的 一 种 技术 。 

LAN (Local Area Network): 指 在 某 一 局 部 区 域内 〈 如 一 个 学 校 、 企 业 、 机 关 ) 由 
多 台 计 算 机 互联 而 成 的 计算 机 组 。 一 般 是 方圆 几 千 米 以 内 ， 各 种 计算 机 ， 外 部 设备 和 数 
据 库 等 互相 联接 起 来 组 成 的 计算 机 通信 网 ， 在 该 网 络 内 ， 可 以 实现 文件 管理 、 应 用 软件 
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共享 、 打 印 机 共享 、 扫 描 仪 共 享 等 服务 功能 。 


第 8 章 常用 存储 高 级 技术 


HSM (Hierarchical Storage Management): 分 层 存储 技术 首先 将 不 同 的 存储 设备 
进行 分 级 管理 ， 形 成 多 个 存储 级 别 ， 然 后 通过 预先 定义 的 数据 生命 周期 或 者 迁移 策略 将 
数据 自动 迁移 到 相应 级 别 的 存储 中 ， 将 访问 频率 高 的 热 数据 迁移 到 高 性 能 的 存储 层级 ， 
将 访问 频率 低 的 冷 数据 迁移 到 低 性 能 大 容量 的 存储 层级 。 

RP0 (Recovery Point 0bjective): 指 灾难 发 生 后 信息 系统 和 业务 数据 必须 恢复 的 
时 间 点 要 求 ， 反 映 恢复 数据 的 完整 性 ， 恢 复 时 间 目 标的 值 越 小 表明 丢失 的 数据 越 少 。 

RTO (Recovery Time 0bjective): 指 灾难 发 生 后 信息 系统 或 业务 功能 从 停止 运作 
至 必须 恢复 运作 的 时 间 要 求 ， 表 示 业 务 从 中 断 到 恢复 正常 所 需 的 时 间 ， 值 越 小 表明 业务 
中 断 时 间 越 短 。 


第 9 章 ， NAS 技术 介绍 


CIFS (Common Internet File System): 是 微软 公司 开发 的 文件 共享 协议 ， 主 要 应 
用 于 Windows 操作 系统 环境 的 文件 系统 共享 。 CIFS 共享 是 指 把 文件 系统 共享 给 通过 认证 
的 用 户 ， 包 括 本 地 认证 用 户 和 域 认证 用 户 ， 用 户 对 CIFS 共享 拥有 相应 的 权限 。 

NIS (Network Information Service): 网 络 信息 服务 是 一 种 可 以 集中 管理 系统 数 
据 库 的 目录 服务 技术 , 提供 了 一 个 网 络 黄页 的 功能 , 为 网 络 中 所 有 的 主机 提供 网 络 信息 。 

AD (Active Directory): 微软 Windows Server 中 ， 人 负责 架构 中 大 型 网 络 环境 的 集 
中 式 目 录 管理 服务 (Directory Services) 

NAS (Network Attached Storage): 一 种 特殊 的 专用 数据 存储 服务 器 ， 包 括 存储 器 
件 〈 例 如 磁盘 阵列 ) 和 内 榜 系 统 软件 ， 可 提供 跨 平台 文件 共享 功能 。NAS 通常 在 一 个 LAN 
上 占有 自己 的 节点 ， 无 需 应 用 服务 器 的 干预 允许 用 户 在 网 络 上 存 取 数据 ， 在 这 种 配置 
中 ，NAS 集中 管理 和 处 理 网 络 上 的 所 有 数据 ， 将 负载 从 应 用 或 企业 服务 器 上 外 载 下 来 ， 
有 效 降低 总 拥有 成 本 , 保护 用 户 投资 。NAS 支持 多 种 协议 (如 NFS、CIFS、FTP、HTTP 等 )， 
而 且 能 够 支持 各 种 操作 系统 。 

LDAP (Lightweight Directory Access Protocol): 一 种 用 于 支持 网 络 环境 下 的 目 
录 服 务 。 在 LDAP 域 环境 中 ， 当 用 户 需 要 访问 应 用 程序 时 ,客户 端 将 用 户 名 和 密码 提供 给 
LDAP 服务 器 ,LDAP 服务 器 将 其 与 目录 数据 库 中 的 认证 信息 进行 比 对 来 确定 用 户 身份 的 合 
法 性 。LDAP 已 逐渐 成 为 网 络 管理 的 重要 工具 。 
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NFS (Network File System): 由 SUN 公司 开发 的 网 络 文件 系统 ,主要 应 用 于 Linux、 
UNIX、Mac 0S 和 VMware 操作 系统 环境 的 文件 系统 共享 。 
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第 11 章 ， 容 灾 备份 技术 基础 


VIL (Virtual Tape Library): 称 为 虚拟 磁带 库 ， 一 种 采用 物理 磁盘 为 存储 介质 ， 
通过 虚拟 化 引擎 来 模拟 机 械 手 臂 、 磁 带 驱动 器 以 及 磁带 插 模 的 磁带 库 ， 它 不 是 真正 意义 
上 的 物理 磁带 库 。VTL 兼 具 物理 磁带 库 和 磁盘 阵列 的 优势 。 

CDP (Continual Data Protection): 一 套 基 于 备份 的 数据 保护 方法 ， 通 过 实时 捕获 或 跟 
踪 数据 的 变化 ， 将 变化 了 的 数据 独立 存放 ， 确 保 数据 可 以 恢复 到 过 去 的 尽 可 能 多 的 时 间 点 。 

TL (Tape Library): 一 种 基于 磁带 的 存储 设备 ， 由 驱动 器 、 磁 带 槽 、 机 械 手 臂 组 
成 ， 机 械 手臂 可 以 按照 预定 程序 自动 拆 印 或 装载 磁带 ， 实 现 自动 备份 和 恢复 功能 。 

Dedup (De-duplication): 一 种 利用 算法 消除 重复 数据 的 技术 ， 也 称 为 去 重 、 消 元 
技术 。 其 基本 原理 是 将 数据 按 一 定 粒 度 进行 切 分 ， 对 相同 的 数据 只 保存 一 次 ， 消 除 元 余 
重复 数据 进而 降低 存储 容量 要 求 。 

NDMP (Network Data Management Protocol): 一 种 用 于 网 络 数据 备份 与 恢复 的 开 
放 性 通信 协议 。 遵 循 NDMP 标准 的 服务 器 不 需要 安装 其 他 备份 代理 ， 即 可 被 支持 NDMP 协 
议 的 备份 软件 控制 进行 数据 备份 和 恢复 。 


“第 12 章 存储 系统 配置 、 运 维和 管理 


IQN (iSCSI Qualified Name): iSCSI 中 ，target 端 识别 initiator 的 唯一 标识 ， 
其 格式 为 :“ign”+“ 年 月 ”+“. ”+ “域名 的 颠倒 ”+“:”+“ 设 备 的 具 体 名 称 ” 如 
jiqn. 2012-04. com. redhat :2cc7d328b934。 借 助 initiator 端的 IQN 号 ，target 端 把 新 
设备 /dev/sdb 注册 给 initiator， 这 样 initiator 就 可 以 使 用 新 磁盘 。 

FTP (File Transfer Protocol1): 用 于 TCP/IP 网 络 上 两 台 计 算 机 之 间 的 文件 传输 
协议 ， 主 要 应 用 于 Internet 环境 。 

HTTP (Hypertext Transfer Protoco1): 用 于 从 WWW (World Wide Web) 服务 器 传 
输 超 文本 到 本 地 浏览 器 的 传送 协议 ， 主 要 应 用 于 Internet 环境 。 
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